UTF-8機種依存文字の変換
他のコードセットからUTF-8にコード変換する場合、一部の文字では変換先の機種によって変換結果が異なります。
以下に、UTF-8機種依存文字の変換について示します。
| 変換前の文字 | 変換後の文字 | ||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Shift-JIS | EUC-JP | IBM漢字 | 富士通漢字 | 日立漢字 | NEC漢字 | 集信側ホストが | 集信側ホストが | ||||||||
| 字体 | 文字 | 字体 | 文字 | 字体 | 文字 | 字体 | 文字 | 字体 | 文字 | 字体 | 文字 | 字体 | 文字 | 字体 | 文字 | 
| 〜 | 0x8160 | 〜 | 0xA1C1 | 〜 | 0x43A1 | 〜 | 0xA1C1 | 〜 | 0xA1C1 | 〜 | 0x4FC1 | ~ | U+FF5E (0xEFBD9E) | 〜 | U+301C (0xE3809C) | 
| ‖ | 0x8161 | ‖ | 0xA1C2 | ‖ | 0x447C | ‖ | 0xA1C2 | ‖ | 0xA1C2 | ‖ | 0x4FC2 | ∥ | U+2225 (0xE288A5) | ‖ | U+2016 (0xE28096) | 
| − | 0x817C | − | 0xA1DD | − | 0x4260 | − | 0xA1DD | − | 0xA1DD | − | 0x4F5A | - | U+FF0D (0xEFBC8D) | − | U+2212 (0xE28892) | 
| ¢ | 0x8191 | ¢ | 0xA1F1 | ¢ | 0x434A | ¢ | 0xA1F1 | ¢ | 0xA1F1 | ¢ | 0x4F76 | ¢ | U+FFE0 (0xEFBFA0) | ¢ | U+00A2  | 
| £ | 0x8192 | £ | 0xA1F2 | (*1) | (*1) | (*1) | (*1) | £ | U+FFE1 (0xEFBFA1) | £ | U+00A3  | ||||
| ¬ | 0x81CA | ¬ | 0xA2CC | (*1) | (*1) | (*1) | (*2) | ¬ | U+FFE2 (0xEFBFA2) | ¬ | U+00AC  | ||||
| *1 | : | 各コードセットの2バイトの“£”または“¬”はMicrosoft準拠の文字に変換されます。 EBCDICの1バイトの“£”または“¬”はUnicode Consortium準拠の文字に変換されます。 ただし、EBCDICの1バイト文字の場合は、EBCDICの設定によっては、該当する文字が存在しない場合があります。 | 
| 
 | 
 | その場合の変換については「EBCDICからの変換」を参照してください。 | 
| *2 | : | 0xEFBFA2との変換は行えません。 |