特定の区切り文字で区切られたファイルを読み取りたい

キーワード:CSV,区切り文字,デリミタ
シナリオ一覧に戻る

概要

特定の区切り文字で区切られたファイルを読み取りたい場合、CSVファイル読み取り処理を使用し、[デリミタ文字]を設定します。

サンプルプロジェクトの説明

「;」(半角セミコロン)で区切られたファイルを読み取り、「,」(半角カンマ)で区切られたファイルを出力します。

処理の流れ

サンプルプロジェクトの処理の流れは以下の通りです。
  1. CSVファイル読み取り処理」で「;」で区切られたファイルを読み取ります。
  2. CSVファイル書き込み処理」で「,」で区切られたファイルを出力します。
実行結果のイメージについては、サンプルプロジェクトのサンプルデータ「output.csv」を参照してください。

ポイントとなる機能

名前 説明 ツールパレット上の場所
CSVファイル読み取り処理 CSV(Comma Separated Values)形式、TSV(Tab Separated Values)形式などの形式のファイルを読み取ります。 「ファイル」-「CSV」-「CSVファイル読み取り」

処理のポイント

CSVファイル読み取り処理の[デリミタモード][デリミタ文字]を設定することで、区切り文字を設定することが可能です。
[デリミタ文字]に「;」を設定することで、列ごとの値を取得しています。

サンプルプロジェクトの使用方法

上記処理を実装したサンプルプロジェクトを用意しています。サンプルプロジェクトを使用する場合の手順は、以下の通りです。

サンプルプロジェクト名 rl_reference_036.zip
  1. サンプルプロジェクトの展開
    サンプルプロジェクト「rl_reference_036.zip」を展開します。

  2. プロジェクトのアップロード
    「rl_reference_036.zip」を展開後に作成される「rl_reference_036プロジェクト」ディレクトリがプロジェクトファイルとなります。
    DataSpider Studioを起動し、マイプロジェクトの画面から[ファイル]-[ローカルからアップロード]で展開したディレクトリ「rl_reference_036プロジェクト」をアップロードしてください。

  3. サンプルデータの準備
    「rl_reference_036.zip」を展開後に作成される「samples」ディレクトリがサンプルデータとなります。
    $DATASPIDER_HOME/server/samplesディレクトリに上書きしてください。

スクリプトの作成手順

プロセスフローおよびデータフローは、「サンプルプロジェクトの説明」のスクリプト画像を参照して適宜設定してください。
  1. デザイナのツールパレット「ファイル」-「CSV」-「CSVファイル読み取り」から、CSVファイル読み取り処理をスクリプトキャンバスに配置します。

  2. デザイナのツールパレット「ファイル」-「CSV」-「CSVファイル書き込み」から、CSVファイル書き込み処理をスクリプトキャンバスに配置します。

  3. スクリプトを実行し、正常終了すれば成功です。