名前 | 処理の概要 | 備考 |
---|---|---|
CSVファイル読み取り処理 | 読み取るデータのサイズが一定量になるまで半分に分割し、複数のスレッドで並列に処理します。(データのサイズやCPUのコア数によっては、中間データを一時ファイルに出力する場合があります。) |
|
結合処理 | 受け渡された入力データを複数のスレッドで並列に処理し、結合処理用の中間データとして一時ファイルに出力して結合します。
結合した結果は適当なキーのグループ単位に分割して出力します。 |
|
集計処理 | 受け渡された入力データを複数のスレッドで並列に処理し、集計を行います。(データのサイズによっては、中間データを一時ファイルに出力する場合があります。)
集計した結果は適当なグループ単位に分割して出力します。グループキーを設定していない場合は分割を行いません。 |
|
ソート処理 | 受け渡された入力データを複数のスレッドで並列に処理し、ソートを行います。(データのサイズやCPUのコア数によっては、中間データを一時ファイルに出力する場合があります。)
順序を保証するため分割は行わず、ソートした結果を出力します。 |
|
CSVファイル書き込み処理 | 受け渡された入力データを複数のスレッドで並列に処理します。結果データの順序は保証されません。 |
|