文字列に含まれる半角スペース・全角スペース・タブ文字を削除したい

キーワード:半角スペース,全角スペース,タブ,正規表現置換
シナリオ一覧に戻る

概要

文字列に含まれる半角スペース・全角スペース・タブ文字を削除したい場合は、正規表現置換ロジックを使用します。

サンプルプロジェクトの説明

CSVファイルを読み取り、正規表現置換ロジックで文字列に含まれる半角スペース・全角スペース・タブ文字を削除します。
変換したデータをCSVファイルに書き込みます。

処理の流れ

サンプルプロジェクトの処理の流れは以下の通りです。
  1. CSVファイル読み取り処理」でCSVファイルを読み取ります。
  2. マッピング処理」の「正規表現置換ロジック」で入力文字列に含まれる半角スペース・全角スペース・タブ文字を削除します。
  3. 変換したデータを「CSVファイル書き込み処理」でCSVファイルを書き込みます。
実行結果のイメージについては、サンプルプロジェクトのサンプルデータ「output.csv」を参照してください。

ポイントとなる機能

名前 説明 ツールパレット上の場所
正規表現置換ロジック 入力文字列を正規表現により置換して返します。 「文字列」-「変換」-「正規表現置換」

処理のポイント

正規表現置換ロジックを使用し、特定文字や文字列の置換が実現できます。
サンプルプロジェクトでは半角スペース・全角スペース・タブ文字を空文字に置換することで削除しています。
正規表現の詳細については「正規表現置換ロジック」のヘルプを参照してください。

サンプルプロジェクトの使用方法

上記処理を実装したサンプルプロジェクトを用意しています。サンプルプロジェクトを使用する場合の手順は、以下の通りです。

サンプルプロジェクトファイル名 rl_reference_033.zip
  1. サンプルプロジェクトの展開
    サンプルプロジェクトファイル「rl_reference_033.zip」を展開します。

  2. プロジェクトのアップロード
    「rl_reference_033.zip」を展開後に作成される「rl_reference_033プロジェクト」ディレクトリがプロジェクトファイルとなります。
    DataSpider Studioを起動し、マイプロジェクトの画面から[ファイル]-[ローカルからアップロード]で展開したディレクトリ「rl_reference_033プロジェクト」をアップロードしてください。

  3. サンプルデータの準備
    「rl_reference_033.zip」を展開後に作成される「samples」ディレクトリがサンプルデータとなります。
    $DATASPIDER_HOME/server/samplesディレクトリに上書きしてください。

スクリプトの作成手順

プロセスフローおよびデータフローは、「サンプルプロジェクトの説明」のスクリプト画像を参照して適宜設定してください。
  1. デザイナのツールパレット「ファイル」-「CSV」-「CSVファイル読み取り」から、CSVファイル読み取り処理をスクリプトキャンバスに配置します。

  2. デザイナのツールパレット「変換」-「基本」-「マッピング」から、マッピング処理をスクリプトキャンバスに配置します。

  3. デザイナのツールパレット「ファイル」-「CSV」-「CSVファイル書き込み」から、CSVファイル書き込み処理をスクリプトキャンバスに配置します。

  4. マッピング処理のsMapperエディタを開き、入力文字列に含まれる半角スペース・全角スペース・タブ文字を削除する処理を作成します。

  5. スクリプトを実行し、正常終了すれば成功です。