マッチング設定項目
マッチングファイルは最大101個まで設定できます。マッチングファイルを複数設定する場合、マッチング番号は設定順に連番で振られます。マッチングはマッチング番号の昇順でヒットしたレコードを生成しますので、マッチングファイルを複数設定し、複数レコードがヒットする場合は、マッチングファイルの設定順序を考慮してください。
入力ファイルの「形式」が“TEXT”の場合、マッチングファイル設定は行えません。
(1) メイン項目
形式
マッチングファイルの形式。選択によって画面が切り替わります。
- CSV
-
: CSV形式
- フォーマット
-
: フォーマット形式
- Excel
-
: Excel形式
- DBテーブル
-
: DBテーブル形式
コメント
設定するマッチングファイルに対するコメント。
(2) マッチング情報の項目
ID
|
|
|
|
マッチング情報の識別ID。
「形式」に応じて、フォーマットID、CSVID、ExcelID、DBテーブルIDを指定します。
「形式」が“CSV”以外のときは必ず指定してください。
ファイル名
|
|
|
マッチング処理に使用するマッチングファイル名。マッチング設定の「形式」が"DBテーブル"の場合は表示されません。絶対パスまたは相対パスで指定します。
入出力ファイルと同一ファイル、標準入力"$STDIN"、および標準出力"$STDOUT"は指定できません。指定した場合は実行時にエラーになります。
省略
|
CSVIDを設定しない場合に指定します。“ON”にすると、「区切り文字」、「囲み文字」が活性化します。
区切り文字
|
区切り文字を選択します。この設定は「省略」を“ON”にした場合に有効となります。
区切り文字(16進数指定)
|
「区切り文字」で“16進数指定”を選択した場合に、任意の区切り文字を指定します。16進文字で入力してください。
囲み文字
|
囲み文字を選択します。この設定は「省略」を“ON”にした場合に有効となります。
「囲み文字」を指定しない場合、すべての入力項目を文字データとして扱います。
囲み文字(16進数指定)
|
「囲み文字」で“16進数指定”を選択した場合に、任意の囲み文字を指定します。16進文字で入力してください。
項目数のチェックを行う
|
「ID」が指定されていた場合、レイアウト情報の項目数と実際のファイルの項目数をチェックするかどうかを選択します。
このチェックボックスをONにすると、レイアウト情報の項目数と実際のファイルの項目数が異なる場合は、データ加工の実行時にエラーになります。また、プレビューの実行時にもエラーになります。
ヘッダレコード設定
|
マッチングファイルのヘッダレコード行数を設定します。タイトル行から指定行までをデータとして取り扱わず、スキップする場合に選択します。指定した行数分をスキップした値が入力データとして扱われます。
レコード数
|
「ヘッダレコード設定」を“ON”にした場合に、スキップするレコードの数を指定します。タイトル行を1とし、最大99レコードまで指定できます。
(3) コード変換項目
漢字コード種
|
|
|
|
マッチングファイルの漢字コード種。"SHIFT-JIS"、"JEF"、"EUC"、"IBM 漢字"、"KEIS"、"NEC 漢字"、"UTF-8"、"UTF-16"、"JIS" から選択します。
マッチング設定の「形式」が"CSV"または"DB テーブル" のときは"SHIFT-JIS"、"EUC"、"UTF-8"、"UTF-16" から選択します。
マッチング設定の「形式」が"Excel"の場合、漢字コード種はUTF-8 で固定です。
この項目は、DataMagic Desktopグレードの場合は表示されますが、変更できません。
Unicodeバイトオーダ
|
|
|
UTF-16のバイトオーダ。
マッチングファイルの「漢字コード種」に“UTF-16”を選択した場合、マッチングファイルのバイトオーダを指定します。
- ホストに依存
-
: 接続先のハードウェア(Windows、UNIX)のバイトオーダに依存します。
- Big Endian
-
: Big Endianを採用します。
- Little Endian
-
: Little Endianを採用します。
この項目は、DataMagic Desktopグレードの場合は表示されません。
EBCDICセット
|
1バイトコードセット種。
マッチングファイルの「漢字コード種」がEBCDIC系、JISコードの場合に指定します。
指定可能なコードセット種を次に示します。
EBCDIC系 |
JIS |
---|---|
EBCDICカナ EBCDIC英小文字 EBCDIC ASCII EBCDIC ASPEN IBM英小文字 IBM英小文字拡張 NECカナ文字 IBMカナ文字拡張
|
EBCDICカナ EBCDIC英小文字 EBCDIC ASCII EBCDIC ASPEN IBM英小文字 IBM英小文字拡張 NECカナ文字 IBMカナ文字拡張 ASCII |
この項目は、DataMagic Desktopグレードの場合は表示されません。
この項目は、マッチング設定の漢字コード種がEBCDIC系(JEF、IBM漢字、KEIS、NEC漢字)で、出力設定の「EBCDICセット」が“ユーザテーブル1”~“ユーザテーブル3”以外のときに有効となります。
改行コード
|
改行コードを16進数で指定します。
指定した改行コードまでをレコードとして判断します。
「漢字コード種」が“UTF-16”のときは4バイトまたは8バイト、それ以外は2バイトまたは4バイトで入力してください。
(4) キー設定項目
キーが複数あった場合
|
|
|
|
マッチングファイルのキー値が複数存在する場合の処理を指定します。
- エラーにする
-
: 変換エラーになります。
- エラーにしない
-
: キーが複数のレコードにヒットした場合、複数レコードの入力データとして処理します。
詳細は「DataMagic 操作マニュアル」を参照してください。
キーがユニークである
|
|
|
|
マッチングファイルのキー値が一意の場合に指定します。チェックを“ON”にすると、“OFF”のときよりも高速に変換できます。ただし、次の条件を満たしている場合のみ有効です。
-
「キーが複数あった場合」で“エラーにする”を設定。
-
条件式のAND、ORの条件が1つのみ。
-
条件式の比較演算子は“==”または“等しい”を設定。
-
入力ファイルの「形式」が“階層フォーマット”または“マルチフォーマット”の場合、それぞれの条件式で参照する項目やタイプがすべて同じになっている。
「キーがユニークである」のチェックボックスが"ON"のとき、ユニークでないキーがあった場合はエラーとなります。
キーがなかった場合
|
|
|
|
マッチングファイルのデータ内に、入力ファイルのキー値と一致する値が存在しない場合の処理を指定します。
この項目に“エラーにしない”を指定すると、デフォルト値を設定できます。
- エラーにする
-
: 変換エラーになります。
- エラーにしない
-
: 「デフォルト値」が設定されている場合は「デフォルト値」を、「デフォルト値」の設定がない場合は項目タイプのデフォルト値が使用されます。
項目タイプのデフォルト値は「DataMagic 操作マニュアル」を参照してください。
デフォルト値設定リスト
|
|
|
|
「キーがなかった場合」で“エラーにしない”を選択したとき、設定したレイアウト情報のID項目を一覧表示します。マッチング時にマッチする項目がない場合に設定されるデフォルト値を指定します。
- 項目No.
-
: 自動採番される項目番号。
「形式」でID指定なしの“CSV”を選択した場合は、ユーザが設定を行う必要があります。
- 項目名
-
: レイアウト情報に設定された項目名。
- 入力タイプ
-
: デフォルト値の入力タイプ。
“文字列”と”文字列(16進)”が指定できます。
- デフォルト値
-
: マッチング時に条件にマッチしないレコードに対して設定する値。
「入力タイプ」が“文字列”の場合は9999バイト以内、“文字列(16進)”の場合は9998バイト以内で指定します。
指定した値は出力時にその入力タイプに変換されます。そのため、入力タイプに適切でない値を指定した場合は変換エラーとなります。
= 備考 ="文字列(16進)"で指定したデフォルト値は、マッチングファイルの漢字コード種として解釈されます。
-
「形式」が“CSV”の場合、デフォルト値はCSV文字列として処理を行います。
-
マッチングファイルの漢字コード種がEBCDIC系の場合、Mタイプの項目に対して”文字列(16進)”でデフォルト値を設定するときは、シフトコードを付加して指定してください。
「キーがなかった場合」で“エラーにしない”を選択した際に、項目ごとにデフォルト値を設定しない場合は、項目型ごとのデフォルト値が採用されます。
(5) 動作設定項目
展開方法
|
|
|
|
変換実行時のマッチングファイルの処理方法を指定します。
- メモリに展開
-
: マッチングファイルをメモリに展開し処理を行います。
“ファイルに展開する”に比べ高速に変換できます。
- ファイルに展開
-
: マッチングファイルをテンポラリファイル(作業中のデータ保存のために一時的に作るファイル)に展開し処理を行います。テンポラリファイルに関する詳細は 「DataMagic 操作マニュアル」を参照してください。
“メモリに展開”を指定した場合、メモリ使用量が増えます。そのため導入環境によってメモリ不足からエラーが発生する場合があります。
文字データの後スペースの扱い
|
|
|
|
入力ファイルとマッチングファイルの文字データを比較するときの、文字の後ろにある全角スペースおよび半角スペースの扱い。
- カットしない
-
: 全角スペースおよび半角スペースをカットしないでデータを比較します。
- カットする
-
: 全角スペースおよび半角スペースをカットしてデータを比較します。たとえば、「AAA○△」は「AAA」とみなして 比較します(「○」は半角スペース、「△」は全角スペース)。