入力設定項目

入力設定の各項目について説明します。

(1) メイン項目

形式

入力ファイルの形式。選択によって画面が切り替わります。

CSV

: CSV形式

フォーマット

: フォーマット形式

マルチフォーマット

: マルチフォーマット形式

階層フォーマット

: 階層フォーマット形式

XML

: XML形式

Excel

: Excel形式

TEXT

: TEXT形式

出力ファイルにはテキストしか選択できません

DBテーブル

: DBテーブル形式

注意

マッチングファイル、条件、マッピング情報が設定されている状態で、この項目の設定を変更すると、マッチングファイル、条件、マッピング情報の設定が削除されるので注意してください。

コメント

設定する入力ファイルに対するコメント。

(2) 入力ファイルの項目

ID

CSV

FMT

MFMT

HFMT

XML

Excel

DB

入力ファイルの識別ID。

形式によって、CSVID、フォーマットID、マルチフォーマットID、階層フォーマットID、XMLID、ExcelID、またはDBテーブルIDを指定します。「形式」が“CSV”または“TEXT”以外のときは必ず指定してください。

注意

マッチングファイル、条件、マッピング情報が設定されている状態で、この項目の設定を変更すると、マッチングファイル、条件、マッピング情報の設定が削除されるので注意してください。

ファイル名

CSV

FMT

MFMT

HFMT

XML

Excel

TEXT

データ加工処理で使用する入力ファイル名。

絶対パスまたは相対パスで指定します。標準入力の場合は、標準入力チェックボックスを“ON”にします。

入力0レコードの扱い

All

入力データのサイズが0バイトだった場合の挙動。

正常

: 正常データとして扱います。

異常

: エラーとします。

標準入力

CSV

FMT

MFMT

TEXT

ファイル名を標準入力にするか否かを選択します。

「標準入力」を設定してデータ加工を実行した場合、入力待ち状態となりますので、データの入力を行ってください。

省略

CSV

「ID」の指定を省略できます。“ON”にすると、「区切り文字」「囲み文字」が活性化します。

区切り文字

CSV

CSV形式ファイルの項目ごとの区切り文字。

プルダウンリストから指定します。

この設定は、「省略」を“ON”にした場合に有効になります。

区切り文字(16進数指定)

CSV

「区切り文字」で“16進数指定”を選択した場合に、任意の区切り文字を指定します。16進文字で入力してください。

囲み文字

CSV

CSV形式ファイルの文字データの囲み文字。

プルダウンリストから指定します。

この設定は、「省略」を“ON”にした場合に有効になります。

注意

「囲み文字」を指定しない場合、すべての入力項目を文字データとして扱います。

囲み文字(16進数指定)

CSV

「囲み文字」で“16進数指定”を選択した場合に、任意の囲み文字を指定します。16進文字で入力してください。

項目数のチェックを行う

CSV

「ID」が指定されていた場合、レイアウト情報の項目数と実際のファイルの項目数をチェックするかどうかを選択します。

このチェックボックスをONにすると、レイアウト情報の項目数と実際のファイルの項目数が異なる場合は、データ加工の実行時にエラーになります。また、プレビューの実行時にもエラーになります。

ヘッダレコード設定

CSV

入力ファイルのヘッダレコード行数を設定します。

指定した行数分をスキップした値が入力データとして扱われます。

ヘッダレコード行数

CSV

「ヘッダレコード設定」を“ON”にした場合に、スキップするレコードの数を指定します。タイトル行を1とし、最大99レコードまで指定できます。

CSVソートキー不正項目の扱い

CSV

入力設定のソート設定で指定した項目が存在しなかった場合の扱い。

この設定は、入力設定でCSVIDを省略した場合に有効な設定です。

許可する

: 存在しない項目の値を空文字として処理します。

許可しない

: 変換せずにエラーとします。

数値バイトオーダ

FMT

MFMT

HFMT

DB

入力ファイルの数値バイトオーダ。

項目タイプBと項目タイプFのときのみ有効になります。

XMLレコード単位

XML

入力ファイルおよび出力ファイルがXML形式の場合の、1レコードの扱い方。

1

: ルートノードが1レコードという扱いになります。

2

: ルートの1階層下の設定ノードが1レコードという扱いになります。

3

: ルートの2階層下の設定ノードが1レコードという扱いになります。

要素

: 指定した要素配下のノードが1レコードという扱いになります。

= 備考 =

XMLレコード単位についての詳細は「DataMagic 操作マニュアル」を参照してください。

数値項目NULL値の扱い

DB

入力データのNULL値の扱い。

入力データにNULL値があった場合、空文字として扱うか、0に置き換えるかを選択します。

0(ゼロ)

: NULL値の場合、Zタイプの0として扱います。

空文字

: NULL値の場合、Mタイプの空文字として扱います。

マッピングを有効にする

TEXT

マッピング設定を可能にするか否かを選択します。

注意

マッピング設定時に関数を利用したい場合を除き、チェックを“OFF”にしてください。チェックを“ON”にした場合は、以下の点に注意してください。

  • ”OFF"にした場合と比較して処理性能が低下します。

  • 他の設定に関わらず入力データのNULL文字以降から改行コードまでの文字列を切り捨てます。

(3) コード変換項目

漢字コード種

All

入力ファイルの漢字コード種。"SHIFT-JIS"、"JEF"、"EUC"、"IBM漢字"、"KEIS"、"NEC漢字"、"UTF-8"、"UTF-16"、"JIS"から選択します。入力設定の「形式」が"CSV"、"XML"、または"DBテーブル"のときは"SHIFT-JIS"、"EUC"、"UTF-8"、"UTF-16"から選択します。

入力設定の「形式」が"Excel"の場合、漢字コード種はUTF-8で固定です。

= 備考 =

この項目は、DataMagic Desktopグレードでは表示されますが、変更できません。

注意

Oracleに接続するデータ加工情報設定の「入力設定」または「出力設定」の「漢字コード種」は、「NLS_LANG」の設定と揃えてください。設定が異なる場合はデータ加工がエラーになります。

Unicodeバイトオーダ

All

UTF-16のバイトオーダ。

入力ファイルの「漢字コード種」に“UTF-16”を選択した場合、入力ファイルのバイトオーダを指定します。

入力設定の「形式」が"Excel"の場合、Unicodeバイトオーダは表示されません。

ホストに依存

: 接続先のハードウェア(Windows、UNIX)のバイトオーダに依存します。

Big Endian

: Big Endianを採用します。

Little Endian

: Little Endianを採用します。

= 備考 =

この項目は、DataMagic Desktopグレードの場合は表示されません。

改行コード

CSV

TEXT

改行コードを指定します。

この改行コードまでをレコードと判断します。

「漢字コード種」が“UTF-16”のときは4バイトまたは8バイト、それ以外は2バイトまたは4バイトで入力してください。

EBCDICセット

FMT

MFMT

HFMT

TEXT

1バイトコードセット種。

入力ファイルの「漢字コード種」がEBCDIC系、JISコードの場合に指定します。

指定可能なコードセット種は以下になります。

表2.36 入力ファイルの1バイトコードセット種(EBCDIC系、JIS)

EBCDIC系

JIS

EBCDICカナ

EBCDIC英小文字

EBCDIC ASCII

EBCDIC ASPEN

IBM英小文字

IBM英小文字拡張

NECカナ文字

IBMカナ文字拡張

 

EBCDICカナ

EBCDIC英小文字

EBCDIC ASCII

EBCDIC ASPEN

IBM英小文字

IBM英小文字拡張

NECカナ文字

IBMカナ文字拡張

ASCII

= 備考 =

この項目は、DataMagic Desktopグレードでは表示されません。

注意

入力漢字コード種がEBCDIC系(JEF、IBM漢字、KEIS、NEC漢字)で、出力設定の「EBCDICセット」が“ユーザテーブル1”~“ユーザテーブル3”以外のときに有効となります。

JIS第一、第二水準に定義されている文字以外も変換する

All

JIS第一、第二水準に定義されている文字以外も変換の対象になります。例えば、JIS第三・第四水準に属している○付き文字や「㈱」などの一般的に使用されやすい文字を、外字テーブルへ登録することなくコード変換できます。

「漢字コード種」で“SHIFT-JIS”、“IBM漢字”、“UTF-8”、および“UTF-16”を指定した場合に有効になります。

= 備考 =

この項目は、DataMagic Desktopグレードでは表示されません。

(4) ソート項目

マージタブで入力マージファイルを設定した場合、このタブで設定した値をマージ後のソート処理に適用します。

入力データをソートする

CSV

FMT

Excel

入力データをソートする場合に指定します。

この項目を指定すると、このタブ内の他の項目が設定可能となります。

No.

CSV

FMT

Excel

キーの番号を自動表示します。

項目No.

CSV

FMT

Excel

ソート条件に使用する項目No.です。

「形式」が“CSV”で、かつIDの設定がない場合は、項目No.を“1”~“1000”までの数値で指定します。それ以外は[参照]ボタンを使用して指定します。

= 備考 =

入力設定の「形式」が"CSV"で、項目No.を直接入力したとき、指定した項目が存在しない場合は実行時エラーとなります。ただし、入力設定のレイアウトタブで「CSVソートキー不正項目の扱い」を"許可する"に設定している場合は、変換が実行されます。

項目名

CSV

FMT

Excel

ソート条件に使用する項目名を、項目選択ダイアログで指定します。

= 備考 =

同じ項目は複数登録できません。

タイプ

CSV

FMT

Excel

ソート条件に使用する項目タイプ。“文字”、“数値”、および“日付”から指定します。

“日付”で指定できる形式については「DataMagic 操作マニュアル」を参照してください。

注意

数値タイプによる指定の場合、内部的に浮動小数点に変換し比較を行います。そのためその精度はWindowsでは比較最大桁数が15桁、UNIX/Linuxでは最大16桁となります。

並び順

CSV

FMT

Excel

ソートの並び順を指定します。

昇順

: 小さい順に並び替えます。文字列の場合、文字コードの小さい順に並び替えます。

降順

: 大きい順に並び替えます。文字列の場合、文字コードの大きい順に並び替えます。

注意

ソートを行う際、DataMagicは中間形式のテンポラリファイルを作成します。詳細は「DataMagic 操作マニュアル」を参照してください。

(5) マージ項目

ファイル名

CSV

FMT

入力マージファイル名を指定します。

設定できる最大数は20件です。

重複行を削除する

CSV

FMT

入力ファイルと入力マージファイルのデータのうち、重複レコードを削除するか否かを選択します。

マージキー

CSV

FMT

重複チェックを行う項目を指定します。

重複行を削除するにチェックを入れた場合に指定できます。

No.

CSV

FMT

マージキーの番号を自動表示します。

項目No.

CSV

FMT

マージキーの項目No.です。

項目名

CSV

FMT

項目No.に該当する項目名を、項目選択ダイアログで指定します。

重複優先キー

CSV

FMT

「重複行を削除する」を指定してレコードを抽出する際、条件に合致するレコードが重複した場合に、どのレコードを優先して抽出するか指定します。

No.

CSV

FMT

重複優先キーの番号を自動表示します。

項目No.

CSV

FMT

重複したレコードで、優先する条件となる項目No.です。

項目名

CSV

FMT

重複したレコードで、優先する条件となる項目を指定します。

タイプ

CSV

FMT

重複優先キーに使用する項目タイプ。“文字”、“数値”、および“日付”から指定します。

並び順

CSV

FMT

重複優先キーに使用する並び順。“昇順”または“降順”を指定します。