UTF-8機種依存文字の変換

他のコードセットからUTF-8にコード変換する場合、一部の文字では変換先の機種によって変換結果が異なります。

以下に、UTF-8機種依存文字の変換について示します。

表A.13 UTF-8機種依存文字の変換
変換前の文字												変換後の文字
Shift-JIS		EUC-JP		IBM漢字		富士通漢字（JEF）		日立漢字（KEIS）		NEC漢字（JIPS（E））		集信側ホストが Windows/IBMi/zOSの場合（Microsoft準拠の場合）		集信側ホストが UNIX/Linux/NonStopの場合（Unicode Consortium準拠の場合）
字体	文字コード	字体	文字コード	字体	文字コード	字体	文字コード	字体	文字コード	字体	文字コード	字体	文字コード	字体	文字コード
〜	0x8160	〜	0xA1C1	〜	0x43A1	〜	0xA1C1	〜	0xA1C1	〜	0x4FC1	～	U+FF5E (0xEFBD9E)	〜	U+301C (0xE3809C)
‖	0x8161	‖	0xA1C2	‖	0x447C	‖	0xA1C2	‖	0xA1C2	‖	0x4FC2	∥	U+2225 (0xE288A5)	‖	U+2016 (0xE28096)
−	0x817C	−	0xA1DD	−	0x4260	−	0xA1DD	−	0xA1DD	−	0x4F5A	－	U+FF0D (0xEFBC8D)	−	U+2212 (0xE28892)
¢	0x8191	¢	0xA1F1	¢	0x434A	¢	0xA1F1	¢	0xA1F1	¢	0x4F76	￠	U+FFE0 (0xEFBFA0)	¢	U+00A2 (0xC2A2)
£	0x8192	£	0xA1F2	(*1)		(*1)		(*1)		(*1)		￡	U+FFE1 (0xEFBFA1)	£	U+00A3 (0xC2A3)
¬	0x81CA	¬	0xA2CC	(*1)		(*1)		(*1)		(*2)		￢	U+FFE2 (0xEFBFA2)	¬	U+00AC (0xC2AC)

*1

:

各コードセットの2バイトの“￡”または“￢”はMicrosoft準拠の文字に変換されます。

EBCDICの1バイトの“£”または“¬”はUnicode Consortium準拠の文字に変換されます。

ただし、EBCDICの1バイト文字の場合は、EBCDICの設定によっては、該当する文字が存在しない場合があります。

		その場合の変換については「EBCDICからの変換」を参照してください。
*2	:	0xEFBFA2との変換は行えません。