特定の区切り文字で区切られたファイルを読み取りたい
キーワード:CSV,区切り文字,デリミタ
シナリオ一覧に戻る
概要
特定の区切り文字で区切られたファイルを読み取りたい場合、CSVファイル読み取り処理を使用し、
[デリミタ文字]
を設定します。
サンプルプロジェクトの説明
「;」(半角セミコロン)で区切られたファイルを読み取り、「,」(半角カンマ)で区切られたファイルを出力します。
処理の流れ
サンプルプロジェクトの処理の流れは以下の通りです。
「
CSVファイル読み取り処理
」で「;」で区切られたファイルを読み取ります。
「
CSVファイル書き込み処理
」で「,」で区切られたファイルを出力します。
実行結果のイメージについては、サンプルプロジェクトのサンプルデータ「output.csv」を参照してください。
ポイントとなる機能
名前
説明
ツールパレット上の場所
CSVファイル読み取り処理
CSV(Comma Separated Values)形式、TSV(Tab Separated Values)形式などの形式のファイルを読み取ります。
「ファイル」-「CSV」-「CSVファイル読み取り」
処理のポイント
CSVファイル読み取り処理の
[デリミタモード]
と
[デリミタ文字]
を設定することで、区切り文字を設定することが可能です。
[デリミタ文字]
に「;」を設定することで、列ごとの値を取得しています。
サンプルプロジェクトの使用方法
上記処理を実装したサンプルプロジェクトを用意しています。サンプルプロジェクトを使用する場合の手順は、以下の通りです。
サンプルプロジェクト名
rl_reference_036.zip
サンプルプロジェクトの展開
サンプルプロジェクト「rl_reference_036.zip」を展開します。
プロジェクトのアップロード
「rl_reference_036.zip」を展開後に作成される「rl_reference_036プロジェクト」ディレクトリがプロジェクトファイルとなります。
DataSpider Studioを起動し、マイプロジェクトの画面から
[ファイル]
-
[ローカルからアップロード]
で展開したディレクトリ「rl_reference_036プロジェクト」をアップロードしてください。
サンプルデータの準備
「rl_reference_036.zip」を展開後に作成される「samples」ディレクトリがサンプルデータとなります。
$DATASPIDER_HOME/server/samplesディレクトリに上書きしてください。
スクリプトの作成手順
プロセスフローおよびデータフローは、「
サンプルプロジェクトの説明
」のスクリプト画像を参照して適宜設定してください。
デザイナのツールパレット「ファイル」-「CSV」-「CSVファイル読み取り」から、CSVファイル読み取り処理をスクリプトキャンバスに配置します。
CSVファイル読み取り処理の設定は、以下のように行います。
[必須設定]タブ
処理のポイント
[デリミタモード]
は、
[一覧から選択]
・
[直接入力]
・
[文字コード入力]
の三種類から選択できます。
「;」(半角セミコロン)で区切られたファイルを読み取るには、以下いずれかの方法があります。
[一覧から選択]
を選択し、
[デリミタ文字]
に「半角セミコロン」を選択する。
[直接入力]
を選択し、
[デリミタ文字]
に「;」を入力する。
[デリミタ文字]
にダブルクォーテーションを設定することはできません。
デザイナのツールパレット「ファイル」-「CSV」-「CSVファイル書き込み」から、CSVファイル書き込み処理をスクリプトキャンバスに配置します。
CSVファイル書き込み処理の設定は、以下のように行います。
[必須設定]タブ
スクリプトを実行し、正常終了すれば成功です。