目次 | 表1. 基礎情報 | 表2. へッダ | 表3. 日本語処理 | 表4. 言語 | 表5. 暗号 | 表6. SMTP, POP, IMAP, LDAP

「表4. 言語」の解説

Last modified: Sat Jan 13 16:13:03 2001

言語

評価方法

表示および作成の文字コードとして使用可能かを示しています。ただし、表示にしか対応していないものは△で示します。

解説

特に厳密には調べていません。表示用の文字コードおよび作成用の文字コードの欄にあるかどうかを調べています。あるいはへルプなどの文書から調べているものもあります。

筆者は文字コードに関する専門家ではないので、記述が間違っている可能性があります。詳しくは参考文献で示したページを見てください。

言語 文字符号化方式 説明
西ヨーロッパ ISO-8859-1 (Latin1) かつての EC 諸国で共通に使える文字
中央ヨーロッパ ISO-8859-2 (Latin2) 東西の壁崩壊後に欧州協定に参加した諸国の文字
南ヨーロッパ ISO-8859-3 (Latin3),
ISO-8859-9 (Latin5)
エスペラント語とマルタ語。
トルコ語に関しては ISO-8859-9 (Latin5) の方が使われている。
バルト言語 ISO-8859-4 (Latin4),
ISO-8859-10 (Latin6)
北欧諸国で使える文字。
ISO-8859-10 (Latin6) が使われている。
キリル言語 ISO-8859-5 (Cyrillic),
KOI8-R (Russian),
KOI8-U (Ukrainaian)
ロシア語としては ISO-8859-5 は使われず、KOI8-R (RFC1489) がデファクトスタンダードのようである。
詳しくは The Cyrillic Charset Soup を参照。
アラビア語 ISO-8859-6 (Arabic) アラビア語
ギリシャ語 ISO-8859-7 (Greek) RFC1947
ヘブライ語 ISO-8859-8 (Hebrew) RFC1555
簡体字中国語 GB2312,
HZ-GB-2312
HZ-GB-2312 に関しては RFC 1842, RFC 1843 を参照。
繁体字中国語 Big5 台湾で用いられている。
日本語 ISO-2022-JP RFC1468
韓国語 ISO-2022-KR,
EUC-KR
RFC 1557 によると、へッダには EUC-KR を MIME 符号化したものを用い、本文には ISO-2022-KR を用いるようである。
UNICODE UTF-8,
UTF-7
IETF の方針として UTF-8 を将来実装することが望まれている。
UTF-7 は原則としては使わない。

参考文献


滝澤 隆史(TAKIZAWA Takashi) taki@cyber.email.ne.jp