UTF-8機種依存文字の変換

他のコードセットからUTF-8にコード変換する場合、一部の文字では変換先の機種によって変換結果が異なります。

以下に、UTF-8機種依存文字の変換について示します。

表A.13 UTF-8機種依存文字の変換

変換前の文字

変換後の文字

Shift-JIS

EUC-JP

IBM漢字

富士通漢字
(JEF)

日立漢字
(KEIS)

NEC漢字
(JIPS(E))

集信側ホストが
Windows/IBMi/zOSの場合
(Microsoft準拠の場合)

集信側ホストが
UNIX/Linux/NonStopの場合
(Unicode Consortium準拠
の場合)

字体

文字
コード

字体

文字
コード

字体

文字
コード

字体

文字
コード

字体

文字
コード

字体

文字
コード

字体

文字
コード

字体

文字
コード

0x8160

0xA1C1

0x43A1

0xA1C1

0xA1C1

0x4FC1

U+FF5E (0xEFBD9E)

U+301C (0xE3809C)

0x8161

0xA1C2

0x447C

0xA1C2

0xA1C2

0x4FC2

U+2225 (0xE288A5)

U+2016 (0xE28096)

0x817C

0xA1DD

0x4260

0xA1DD

0xA1DD

0x4F5A

U+FF0D (0xEFBC8D)

U+2212 (0xE28892)

¢

0x8191

¢

0xA1F1

¢

0x434A

¢

0xA1F1

¢

0xA1F1

¢

0x4F76

U+FFE0 (0xEFBFA0)

¢

U+00A2
(0xC2A2)

£

0x8192

£

0xA1F2

(*1)

(*1)

(*1)

(*1)

U+FFE1 (0xEFBFA1)

£

U+00A3
(0xC2A3)

¬

0x81CA

¬

0xA2CC

(*1)

(*1)

(*1)

(*2)

U+FFE2 (0xEFBFA2)

¬

U+00AC
(0xC2AC)

*1

:

各コードセットの2バイトの“£”または“¬”はMicrosoft準拠の文字に変換されます。

EBCDICの1バイトの“£”または“¬”はUnicode Consortium準拠の文字に変換されます。

ただし、EBCDICの1バイト文字の場合は、EBCDICの設定によっては、該当する文字が存在しない場合があります。

 

 

その場合の変換については「EBCDICからの変換」を参照してください。

*2

:

0xEFBFA2との変換は行えません。