charmap

Autres langues

Langue: ja

Version: 1994-11-28 (mandriva - 01/05/08)

Autres sections - même nom

Section: 5 (Format de fichier)

名前

charmap - 文字符号化を定義するための文字シンボル

書式

文字集合記述 (charmap) は使用できる文字集合とその符号化を定義する。 サポートされる全ての文字集合は妥当なサブセットとして 共通文字集合 (portable character set) を持たなければならない。

文法

charmap ファイルは以下のキーワードからなるヘッダーで始まる:
<codeset>
はコードセットの名前を指定する。
<mb_cur_max>
は複数バイト文字の一文字あたりの最大バイト数を指定する。 複数バイト文字は現在のところサポートされていない。デフォルトは 1 である。
<mb_cur_min>
は一文字あたりの最低バイト数を指定する。この値は mb_cur_max 以下でなければならない。 もし指定されなければデフォルトは mb_cur_max と同じである。
<escape_char>
ファイルの残りの部分でエスケープ・キャラクターとして使用する文字 を指定する。これで特殊な意味に解釈される文字をエスケープする。 デフォルトはバックスラッシュ (\) である。
<comment_char>
はファイルの残りの部分でコメント・キャラクターとして使用する文字 を指定する。デフォルトではシャープ (#) である。

charmap の定義そのものは第一カラムにキーワード CHARMAP を置くことで始める。

以下の行は文字の符号化を定義するための二つの方法である:

<symbolic-name> <encoding> <comments>
これは一つの文字とその符号化を定義する。
<symbolic-name>...<symbolic-name> <encoding> <comments>
この形式は複数の文字を定義する。これは複数バイト文字 (現在は実装されていない) のみで有用である。

charmap の定義の最後の行は END CHARMAP を置く。

シンボル名

文字の シンボル名 (symbolic name)共通文字集合(portable character set) の文字のみを含んでいる。 この名前はかぎかっこ < > で挟む。 <escape_char> に続く文字はそれ自身として解釈される。例えば '<\\\>>' のような文字列は '\>' というシンボル名をかぎかっこで狭んで表現している。

文字符号化

符号化は以下の三つの形式のどれかで表す:
<escape_char>d<数字>
は 10 進の数値を表す。
<escape_char>x<数字>
は 16 進の数値を表す。
<escape_char><数字>
は 8 進の数値を表す。

ファイル

/usr/share/i18n/charmaps/*

準拠

POSIX.2

関連項目

locale(1), localedef(1), localeconv(3), setlocale(3), locale(5)