表示および作成の文字コードとして使用可能かを示しています。ただし、表示にしか対応していないものは△で示します。
特に厳密には調べていません。表示用の文字コードおよび作成用の文字コードの欄にあるかどうかを調べています。あるいはへルプなどの文書から調べているものもあります。
筆者は文字コードに関する専門家ではないので、記述が間違っている可能性があります。詳しくは参考文献で示したページを見てください。
言語 | 文字符号化方式 | 説明 |
---|---|---|
西ヨーロッパ | ISO-8859-1 (Latin1) | かつての EC 諸国で共通に使える文字 |
中央ヨーロッパ | ISO-8859-2 (Latin2) | 東西の壁崩壊後に欧州協定に参加した諸国の文字 |
南ヨーロッパ | ISO-8859-3 (Latin3), ISO-8859-9 (Latin5) |
エスペラント語とマルタ語。 トルコ語に関しては ISO-8859-9 (Latin5) の方が使われている。 |
バルト言語 | ISO-8859-4 (Latin4), ISO-8859-10 (Latin6) |
北欧諸国で使える文字。 ISO-8859-10 (Latin6) が使われている。 |
キリル言語 | ISO-8859-5 (Cyrillic), KOI8-R (Russian), KOI8-U (Ukrainaian) |
ロシア語としては ISO-8859-5 は使われず、KOI8-R (RFC1489) がデファクトスタンダードのようである。 詳しくは The Cyrillic Charset Soup を参照。 |
アラビア語 | ISO-8859-6 (Arabic) | アラビア語 |
ギリシャ語 | ISO-8859-7 (Greek) | RFC1947 |
ヘブライ語 | ISO-8859-8 (Hebrew) | RFC1555 |
簡体字中国語 | GB2312, HZ-GB-2312 |
HZ-GB-2312 に関しては RFC 1842, RFC 1843 を参照。 |
繁体字中国語 | Big5 | 台湾で用いられている。 |
日本語 | ISO-2022-JP | RFC1468 |
韓国語 | ISO-2022-KR, EUC-KR |
RFC 1557 によると、へッダには EUC-KR を MIME 符号化したものを用い、本文には ISO-2022-KR を用いるようである。 |
UNICODE | UTF-8, UTF-7 |
IETF の方針として UTF-8 を将来実装することが望まれている。 UTF-7 は原則としては使わない。 |