可変長ウィザード 操作ガイド

可変長ウィザードとは

DataSpider Servista可変長ウィザードとは、ドラッグ&ドロップ操作で可変長形式のテキストファイルのスキーマ定義を行うことができる機能です。

可変長形式のテキストファイルについて

ここでは、DataSpider Servistaが扱う可変長形式のテキストファイル(以下、可変長ファイルと呼ぶ)について説明します。

可変長ファイルで最も基本的な構造はレコード(record)です。レコードはテキストファイルの1行を表しており、行頭から行末(改行文字)までを1レコードと呼びます。各レコードは複数のフィールド(field)で構成されており、各フィールドは任意の文字列(デリミタ)で分けられています(図1)。

各フィールドにはそれぞれ型(文字列・数字・日付・タグ)を指定することができます。文字列・数字・日付はフィールドの整合性を調べるのに用いられます。 また、タグはレコード識別コードです。タグは文字列で指定します。タグを指定することで、可変長のトランザクション(ある文字列がある特定の位置に現われるまで行を繰り返し処理する)を正しく扱うことができます。


DataSpider Servistaでは、各レコードがすべて同じフォーマットである必要はなく、フィールドの数や型が異なっていても構いません。

また、レコードには出現回数を指定することができます。あるレコードが必ず3行現れるという場合に指定します。制限なし(0〜無制限)を設定することも可能です。

複数のレコードをひとまとまりとして扱うのがグループ(group)です(図3)。グループに含まれる各レコードは可変長ファイルに現われる順番に並んでおり、各レコードで指定されているフィールドの数や型が可変長形式のテキストファイルと完全に一致する必要があります。

レコードにおけるフィールドと同様に、各グループでそれらのグループを構成するレコードの順番や数が違っていても問題はありません。


また、各グループには出現回数を指定することができます。制限なし(0〜無制限)を指定することも可能です。

可変長ウィザードの起動方法

可変長ウィザードは、デザイナにある可変長ファイル読み取りオペレーションから起動することができます。

可変長フォーマット定義の追加


  1. 可変長ファイル読み取りオペレーションのプロパティから[フォーマット]を選択して[追加]をクリックします。




  2. 「可変長ファイルフォーマット定義」ダイアログが開きます。
    任意で名前を入力します。

  3. [可変長ウィザードの起動]をクリックします。

可変長フォーマット定義の編集


  1. 可変長ファイル読み取りオペレーションのプロパティから[フォーマット]を選択して[一覧の編集]をクリックします。

  2. 「リソース一覧の編集」ダイアログが開きます。




  3. [リソース一覧]から編集したいフォーマット定義を選択します。

  4. [可変長ウィザードの起動]をクリックします。


  5. [リソース一覧]からフォーマット定義を追加・削除をすることができます。

可変長ウィザードの概念




構造定義とは

読み込みを行う可変長ファイルの構造を定義します。
DataSpider はこの定義にそってファイルを読み込みます。

構造定義は構造定義アイコンを親にツリー構造で表現されます。

列一覧とは

DataSpider Designerで使用するデータ形式を設定できます。
この設定により必要な情報だけを取り出すことが可能です。

列一覧は構造定義で設定した要素を登録することができます。
また、列一覧はテーブルモデル型と同様の構造です。

テーブルモデル型については「データモデル」を参照してください。

可変長ウィザードの設定方法(構造定義)

構造定義では、可変長ファイルを読み込む際のデータ形式を定義します。

構造定義の設定手順(グループの追加)


  1. 「構造定義アイコン」を右クリックし、[追加]-[グループ]を選択します。

  2. プロパティが開きますので、プロパティを設定します。


  3. グループのプロパティ

    項目名 必須/省略可 説明 補足
    グループ名 必須 任意のグループ名を入力します。  
    出現回数 省略可 グループの出現回数を入力します。
    • [無制限]のチェックをはずすことで、入力できるようになります。
    省略可 省略可 [出現回数]を省略するかどうかを選択します。
    • [チェックあり]:(デフォルト)
      [出現回数]を省略します。
    • [チェックなし]:
      [出現回数]を入力します。
     
    無制限 省略可 [出現回数]を無制限にするかどうかを選択します。
    • [チェックあり]:(デフォルト)
      [出現回数]を無制限にします。
    • [チェックなし]:
      [出現回数]を制限します。
     

  4. 構造定義にアイコンが登録されます。



    グループは青色のアイコンで表現されます。

構造定義の設定手順(レコードの追加)


  1. 「構造定義アイコン」を右クリックし、[追加]-[レコード]を選択します。

  2. プロパティが開きますので、プロパティを設定します。

    レコードのプロパティ

    項目名 必須/省略可 説明 補足
    レコード名 必須 任意のレコード名を入力します。  
    出現回数 省略可 グループの出現回数を入力します。
    • [無制限]のチェックを入れないことで、入力できるようになります。
    省略可 省略可 [出現回数]を省略するかどうかを選択します。
    • [チェックあり]:(デフォルト)
      [出現回数]を省略します。
    • [チェックなし]:
      [出現回数]を入力します。
     
    無制限 省略可 [出現回数]を無制限にするかどうかを選択します。
    • [チェックあり]:(デフォルト)
      [出現回数]を無制限にします。
    • [チェックなし]:
      [出現回数]を制限します。
     

  3. 構造定義にアイコンが登録されます。


    レコードは緑色のアイコンで表現されます。

構造定義の設定手順(フィールドの追加)


  1. 「レコード」を右クリックし、[追加]-[フィールド]を選択します。

  2. プロパティが開きますので、プロパティを設定します。

    フィールドのプロパティ

    項目名 必須/省略可 説明 補足
    フィールド名 必須 任意のフィールド名を入力します。  
    フィールド型 必須 フィールドの型を指定します。指定できる型は以下の型です。
    • [文字列]:(デフォルト)
    • [数値]
    • [日付]
    • [タグ]
     
    タグ 省略可 タグ(レコード識別コード)を入力します。
    • [フィールド型][タグ]を選択した場合、有効になります。
    日付フォーマット 省略可 日付のフォーマットを選択または入力します。
    年号 意味 表示
    y 数値 1996
    M テキストまたは数値 July&07
    d 数値 10
    h 時(1〜12) 数値 12
    H 時(0〜23) 数値 0
    m 数値 30
    s 数値 30
    S ミリ秒 数値 978
    • [フィールド型][日付]を選択した場合、有効になります。
    • デフォルトは「$yy$MM$dd」です。

  3. 構造定義にアイコンが登録されます。


    フィールドは黄色のアイコンで表現されます。

プロパティの編集方法

可変長ウィザードの設定方法(列一覧)

列一覧では, 構造定義で読み込んだデータのDesigner上で扱うデータ形式を定義します。

構造定義の追加

列一覧の編集

構造定義ファイルのエクスポート/インポート機能について

ウィザードで定義した構造定義、列一覧をCSV形式のファイルに保存し、そのファイルから構造定義、列一覧を復元することができます。 一度作られた構造定義ファイルは、読み取り処理、書き込み処理の両方で使用することができます。

構造定義ファイルの仕様

グループ

種別 指定できる文字 必須/省略可 備考
1 プレフィックス GROUP または G 必須 大文字、小文字は区別しません。
2 グループ名 任意の文字列 必須  
3 出現回数 0 以上 2147483647 以下の数字 省略可 省略した場合は「無制限」が設定されます。
4 必須 true または false 省略可 省略した場合は「false」が設定されます。

記述例:グループ名はヘッダーグループ、出現回数は無制限で省略可。

GROUP,ヘッダーグループ,,

レコード

種別 指定できる文字 必須/省略可 備考
1 プレフィックス RECORD または R 必須 大文字、小文字は区別しません。
2 レコード名 任意の文字列 必須  
3 出現回数 0 以上 2147483647 以下の数字 省略可 省略した場合は「無制限」が設定されます。
4 必須 true または false 省略可 省略した場合「false」が設定されます。

記述例:レコード名はヘッダーレコード、出現回数は無制限で省略可。

RECORD,ヘッダーレコード,,

フィールド

種別 指定できる文字 必須/省略可 備考
1 プレフィックス FIELD または F 必須 大文字、小文字は区別しません。
2 フィールド名 任意の文字列 必須  
3 各型の指定できる文字は以下の通りです。

指定できる文字
文字列 string または S
数値 numeric または N
タグ tag または T
日付 date または D

必須 大文字、小文字は区別しません。
4 型設定 タグまたは日付フォーマット 省略可 型が「タグ」または「日付」の場合は必須です。
5 出力 true または false 省略可
  • 構造定義したフィールドを出力するか否かを指定します。出力する場合は「true」です。
  • 省略した場合は「false」が設定されます。

記述例:フィールド名はヘッダー、型は文字列型。

FIELD,ヘッダー,S,,

構造定義ファイルのエクスポート


  1. [構造定義ファイル]メニューから[エクスポート]を選択します。



  2. ダイアログが起動したら、エクスポート先のファイルを選択または入力します。



  3. [完了]ボタンを押下して、エクスポートに成功すると次のダイアログが表示されます。



  4. エクスポートされた内容は以下の通りです。

  5. GROUP,グループ,,false
    RECORD,レコード,,false
    FIELD,タグ,tag,HDR,false
    FIELD,文字列,string,,true ← 列一覧に出力されるフィールド
    FIELD,数値,numeric,,true ← 列一覧に出力されるフィールド
    FIELD,日付,date,$yyyy/$MM/$dd,false

構造定義ファイルのインポート



  1. [構造定義ファイル]メニューから[インポート]を選択します。



  2. ダイアログが起動したら、インポートするファイルを選択または入力します。



  3. [完了]ボタンを押下して、インポートに成功するとウィザードに構造定義が表示されます。



  4. 既に構造定義が存在する場合は、上書きするかどうかの警告ダイアログが表示されます。

構造定義ファイルを編集する場合の注意点