入力設定項目
入力設定の各項目について説明します。
(1) メイン項目
形式
入力ファイルの形式。選択によって画面が切り替わります。
- CSV
-
: CSV形式
- フォーマット
-
: フォーマット形式
- マルチフォーマット
-
: マルチフォーマット形式
- 階層フォーマット
-
: 階層フォーマット形式
- XML
-
: XML形式
- Excel
-
: Excel形式
- TEXT
-
: TEXT形式
出力ファイルにはテキストしか選択できません
- DBテーブル
-
: DBテーブル形式
マッチングファイル、条件、マッピング情報が設定されている状態で、この項目の設定を変更すると、マッチングファイル、条件、マッピング情報の設定が削除されるので注意してください。
コメント
設定する入力ファイルに対するコメント。
(2) 入力ファイルの項目
ID
|
|
|
|
|
|
|
入力ファイルの識別ID。
形式によって、CSVID、フォーマットID、マルチフォーマットID、階層フォーマットID、XMLID、ExcelID、またはDBテーブルIDを指定します。「形式」が“CSV”または“TEXT”以外のときは必ず指定してください。
マッチングファイル、条件、マッピング情報が設定されている状態で、この項目の設定を変更すると、マッチングファイル、条件、マッピング情報の設定が削除されるので注意してください。
ファイル名
|
|
|
|
|
|
|
データ加工処理で使用する入力ファイル名。
絶対パスまたは相対パスで指定します。標準入力の場合は、標準入力チェックボックスを“ON”にします。
入力0レコードの扱い
|
入力データのサイズが0バイトだった場合の挙動。
- 正常
-
: 正常データとして扱います。
- 異常
-
: エラーとします。
標準入力
|
|
|
|
ファイル名を標準入力にするか否かを選択します。
「標準入力」を設定してデータ加工を実行した場合、入力待ち状態となりますので、データの入力を行ってください。
省略
|
「ID」の指定を省略できます。“ON”にすると、「区切り文字」「囲み文字」が活性化します。
区切り文字
|
CSV形式ファイルの項目ごとの区切り文字。
プルダウンリストから指定します。
この設定は、「省略」を“ON”にした場合に有効になります。
区切り文字(16進数指定)
|
「区切り文字」で“16進数指定”を選択した場合に、任意の区切り文字を指定します。16進文字で入力してください。
囲み文字
|
CSV形式ファイルの文字データの囲み文字。
プルダウンリストから指定します。
この設定は、「省略」を“ON”にした場合に有効になります。
「囲み文字」を指定しない場合、すべての入力項目を文字データとして扱います。
囲み文字(16進数指定)
|
「囲み文字」で“16進数指定”を選択した場合に、任意の囲み文字を指定します。16進文字で入力してください。
項目数のチェックを行う
|
「ID」が指定されていた場合、レイアウト情報の項目数と実際のファイルの項目数をチェックするかどうかを選択します。
このチェックボックスをONにすると、レイアウト情報の項目数と実際のファイルの項目数が異なる場合は、データ加工の実行時にエラーになります。また、プレビューの実行時にもエラーになります。
ヘッダレコード設定
|
入力ファイルのヘッダレコード行数を設定します。
指定した行数分をスキップした値が入力データとして扱われます。
ヘッダレコード行数
|
「ヘッダレコード設定」を“ON”にした場合に、スキップするレコードの数を指定します。タイトル行を1とし、最大99レコードまで指定できます。
CSVソートキー不正項目の扱い
|
入力設定のソート設定で指定した項目が存在しなかった場合の扱い。
この設定は、入力設定でCSVIDを省略した場合に有効な設定です。
- 許可する
-
: 存在しない項目の値を空文字として処理します。
- 許可しない
-
: 変換せずにエラーとします。
数値バイトオーダ
|
|
|
|
入力ファイルの数値バイトオーダ。
項目タイプBと項目タイプFのときのみ有効になります。
XMLレコード単位
|
入力ファイルおよび出力ファイルがXML形式の場合の、1レコードの扱い方。
- 1
-
: ルートノードが1レコードという扱いになります。
- 2
-
: ルートの1階層下の設定ノードが1レコードという扱いになります。
- 3
-
: ルートの2階層下の設定ノードが1レコードという扱いになります。
- 要素
-
: 指定した要素配下のノードが1レコードという扱いになります。
XMLレコード単位についての詳細は「DataMagic 操作マニュアル」を参照してください。
数値項目NULL値の扱い
|
入力データのNULL値の扱い。
入力データにNULL値があった場合、空文字として扱うか、0に置き換えるかを選択します。
- 0(ゼロ)
-
: NULL値の場合、Zタイプの0として扱います。
- 空文字
-
: NULL値の場合、Mタイプの空文字として扱います。
マッピングを有効にする
|
マッピング設定を可能にするか否かを選択します。
マッピング設定時に関数を利用したい場合を除き、チェックを“OFF”にしてください。チェックを“ON”にした場合は、以下の点に注意してください。
-
”OFF"にした場合と比較して処理性能が低下します。
-
他の設定に関わらず入力データのNULL文字以降から改行コードまでの文字列を切り捨てます。
(3) コード変換項目
漢字コード種
|
入力ファイルの漢字コード種。"SHIFT-JIS"、"JEF"、"EUC"、"IBM漢字"、"KEIS"、"NEC漢字"、"UTF-8"、"UTF-16"、"JIS"から選択します。入力設定の「形式」が"CSV"、"XML"、または"DBテーブル"のときは"SHIFT-JIS"、"EUC"、"UTF-8"、"UTF-16"から選択します。
入力設定の「形式」が"Excel"の場合、漢字コード種はUTF-8で固定です。
この項目は、DataMagic Desktopグレードでは表示されますが、変更できません。
Oracleに接続するデータ加工情報設定の「入力設定」または「出力設定」の「漢字コード種」は、「NLS_LANG」の設定と揃えてください。設定が異なる場合はデータ加工がエラーになります。
Unicodeバイトオーダ
|
UTF-16のバイトオーダ。
入力ファイルの「漢字コード種」に“UTF-16”を選択した場合、入力ファイルのバイトオーダを指定します。
入力設定の「形式」が"Excel"の場合、Unicodeバイトオーダは表示されません。
- ホストに依存
-
: 接続先のハードウェア(Windows、UNIX)のバイトオーダに依存します。
- Big Endian
-
: Big Endianを採用します。
- Little Endian
-
: Little Endianを採用します。
この項目は、DataMagic Desktopグレードの場合は表示されません。
改行コード
|
|
改行コードを指定します。
この改行コードまでをレコードと判断します。
「漢字コード種」が“UTF-16”のときは4バイトまたは8バイト、それ以外は2バイトまたは4バイトで入力してください。
EBCDICセット
|
|
|
|
1バイトコードセット種。
入力ファイルの「漢字コード種」がEBCDIC系、JISコードの場合に指定します。
指定可能なコードセット種は以下になります。
EBCDIC系 |
JIS |
---|---|
EBCDICカナ EBCDIC英小文字 EBCDIC ASCII EBCDIC ASPEN IBM英小文字 IBM英小文字拡張 NECカナ文字 IBMカナ文字拡張
|
EBCDICカナ EBCDIC英小文字 EBCDIC ASCII EBCDIC ASPEN IBM英小文字 IBM英小文字拡張 NECカナ文字 IBMカナ文字拡張 ASCII |
この項目は、DataMagic Desktopグレードでは表示されません。
入力漢字コード種がEBCDIC系(JEF、IBM漢字、KEIS、NEC漢字)で、出力設定の「EBCDICセット」が“ユーザテーブル1”~“ユーザテーブル3”以外のときに有効となります。
JIS第一、第二水準に定義されている文字以外も変換する
|
JIS第一、第二水準に定義されている文字以外も変換の対象になります。例えば、JIS第三・第四水準に属している○付き文字や「㈱」などの一般的に使用されやすい文字を、外字テーブルへ登録することなくコード変換できます。
「漢字コード種」で“SHIFT-JIS”、“IBM漢字”、“UTF-8”、および“UTF-16”を指定した場合に有効になります。
この項目は、DataMagic Desktopグレードでは表示されません。
(4) ソート項目
マージタブで入力マージファイルを設定した場合、このタブで設定した値をマージ後のソート処理に適用します。
入力データをソートする
|
|
|
入力データをソートする場合に指定します。
この項目を指定すると、このタブ内の他の項目が設定可能となります。
No.
|
|
|
キーの番号を自動表示します。
項目No.
|
|
|
ソート条件に使用する項目No.です。
「形式」が“CSV”で、かつIDの設定がない場合は、項目No.を“1”~“1000”までの数値で指定します。それ以外は[参照]ボタンを使用して指定します。
入力設定の「形式」が"CSV"で、項目No.を直接入力したとき、指定した項目が存在しない場合は実行時エラーとなります。ただし、入力設定のレイアウトタブで「CSVソートキー不正項目の扱い」を"許可する"に設定している場合は、変換が実行されます。
項目名
|
|
|
ソート条件に使用する項目名を、項目選択ダイアログで指定します。
同じ項目は複数登録できません。
タイプ
|
|
|
ソート条件に使用する項目タイプ。“文字”、“数値”、および“日付”から指定します。
“日付”で指定できる形式については「DataMagic 操作マニュアル」を参照してください。
数値タイプによる指定の場合、内部的に浮動小数点に変換し比較を行います。そのためその精度はWindowsでは比較最大桁数が15桁、UNIX/Linuxでは最大16桁となります。
並び順
|
|
|
ソートの並び順を指定します。
- 昇順
-
: 小さい順に並び替えます。文字列の場合、文字コードの小さい順に並び替えます。
- 降順
-
: 大きい順に並び替えます。文字列の場合、文字コードの大きい順に並び替えます。
ソートを行う際、DataMagicは中間形式のテンポラリファイルを作成します。詳細は「DataMagic 操作マニュアル」を参照してください。
(5) マージ項目
ファイル名
|
|
入力マージファイル名を指定します。
設定できる最大数は20件です。
重複行を削除する
|
|
入力ファイルと入力マージファイルのデータのうち、重複レコードを削除するか否かを選択します。
マージキー
|
|
重複チェックを行う項目を指定します。
重複行を削除するにチェックを入れた場合に指定できます。
No.
|
|
マージキーの番号を自動表示します。
項目No.
|
|
マージキーの項目No.です。
項目名
|
|
項目No.に該当する項目名を、項目選択ダイアログで指定します。
重複優先キー
|
|
「重複行を削除する」を指定してレコードを抽出する際、条件に合致するレコードが重複した場合に、どのレコードを優先して抽出するか指定します。
No.
|
|
重複優先キーの番号を自動表示します。
項目No.
|
|
重複したレコードで、優先する条件となる項目No.です。
項目名
|
|
重複したレコードで、優先する条件となる項目を指定します。
タイプ
|
|
重複優先キーに使用する項目タイプ。“文字”、“数値”、および“日付”から指定します。
並び順
|
|
重複優先キーに使用する並び順。“昇順”または“降順”を指定します。