charmap -
文字集合記述ファイル
文字集合記述 (charmap)
は、ある文字集合において使用できるすべての文字とその符号化を定義する。
localedef(1) は、
文字集合記述を使って、
別の文字集合向けのロケールの派生版を作成することができる。
charmap
ファイルは以下のキーワードからなるヘッダーで始まる:
- <code_set_name>
- キャラクターマップの名前を指定する。
- <comment_char>
- ファイルの残りの部分でコメントキャラクターとして使用する文字
を指定する。デフォルトではシャープ
(#) である。
- <escape_char>
- ファイルの残りの部分でエスケープキャラクターとして使用する文字を
指定する。これは特殊な意味に解釈される文字をエスケープするのに使用する。
デフォルトはバックスラッシュ
(\) である。
- <mb_cur_max>
- 一文字あたりの最大バイト数を指定する。
デフォルトは 1
である。
- <mb_cur_min>
- 一文字あたりの最小バイト数を指定する。この値は
< mb_cur_max>
以下でなければならない。
指定されなかった場合のデフォルト値は
< mb_cur_max> である。
文字集合定義のセクションは、
第一カラムにキーワード
CHARMAP
を置くことで始める。
続く行では以下の 2
つの方法のいずれかを使って文字集合を定義する。
- <character> byte-sequence comment
- ある 1
文字とそのバイト列を定義する。
comment は省略可能。
- <character>..<character> byte-sequence comment
- これは文字の範囲とそのバイト列を定義する。
comment は省略可能。
文字集合定義のセクションは文字列
END CHARMAP で終了する。
文字集合定義のセクションの後ろに、文字幅を定義するセクションを続けることができる。
WIDTH_DEFAULT
キーワードを使って、リストに明示的に載っていない全文字で使用されるデフォルトの文字幅を定義できる。
デフォルトの文字幅は
1 である。
個別の文字の文字幅定義のセクションは、
第一カラムにキーワード
WIDTH
を置いて開始する。
続く行では以下の 2
つの方法のいずれかを使って文字幅を定義する。
- <character> width
- 指定した 1
文字の幅を定義する。
- <character>...<character> width
- 指定した範囲の全文字の幅を定義する。
文字幅定義のセクションは文字列
END WIDTH で終了する。
- /usr/share/i18n/charmaps
- デフォルトのキャラクターマップの通常のパス。
POSIX.2.
ユーロ記号は
UTF-8
キャラクターマップでは以下のように定義される。
<U20AC> /xe2/x82/xac EURO SIGN
iconv(1),
locale(1),
localedef(1),
locale(5),
charsets(7)
この man ページは Linux
man-pages
プロジェクトのリリース
5.10
の一部である。プロジェクトの説明とバグ報告に関する情報は
https://www.kernel.org/doc/man-pages/
に書かれている。