UTF-8機種依存文字の変換
他のコードセットからUTF-8にコード変換する場合、一部の文字では変換先の機種によって変換結果が異なります。
以下に、UTF-8機種依存文字の変換について示します。
変換前の文字 |
変換後の文字 |
||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Shift-JIS |
EUC-JP |
IBM漢字 |
富士通漢字 |
日立漢字 |
NEC漢字 |
集信側ホストが |
集信側ホストが |
||||||||
字体 |
文字 |
字体 |
文字 |
字体 |
文字 |
字体 |
文字 |
字体 |
文字 |
字体 |
文字 |
字体 |
文字 |
字体 |
文字 |
〜 |
0x8160 |
〜 |
0xA1C1 |
〜 |
0x43A1 |
〜 |
0xA1C1 |
〜 |
0xA1C1 |
〜 |
0x4FC1 |
~ |
U+FF5E (0xEFBD9E) |
〜 |
U+301C (0xE3809C) |
‖ |
0x8161 |
‖ |
0xA1C2 |
‖ |
0x447C |
‖ |
0xA1C2 |
‖ |
0xA1C2 |
‖ |
0x4FC2 |
∥ |
U+2225 (0xE288A5) |
‖ |
U+2016 (0xE28096) |
− |
0x817C |
− |
0xA1DD |
− |
0x4260 |
− |
0xA1DD |
− |
0xA1DD |
− |
0x4F5A |
- |
U+FF0D (0xEFBC8D) |
− |
U+2212 (0xE28892) |
¢ |
0x8191 |
¢ |
0xA1F1 |
¢ |
0x434A |
¢ |
0xA1F1 |
¢ |
0xA1F1 |
¢ |
0x4F76 |
¢ |
U+FFE0 (0xEFBFA0) |
¢ |
U+00A2 |
£ |
0x8192 |
£ |
0xA1F2 |
(*1) |
(*1) |
(*1) |
(*1) |
£ |
U+FFE1 (0xEFBFA1) |
£ |
U+00A3 |
||||
¬ |
0x81CA |
¬ |
0xA2CC |
(*1) |
(*1) |
(*1) |
(*2) |
¬ |
U+FFE2 (0xEFBFA2) |
¬ |
U+00AC |
*1 |
: |
各コードセットの2バイトの“£”または“¬”はMicrosoft準拠の文字に変換されます。 EBCDICの1バイトの“£”または“¬”はUnicode Consortium準拠の文字に変換されます。 ただし、EBCDICの1バイト文字の場合は、EBCDICの設定によっては、該当する文字が存在しない場合があります。 |
|
|
その場合の変換については「EBCDICからの変換」を参照してください。 |
*2 |
: |
0xEFBFA2との変換は行えません。 |