データ活用やDXがどんどん解る用語集
ETL
用語集 コラム一覧
- Vol.1 ETL
- Vol.2 DWH
- Vol.3 データレイク
- Vol.4 EAI
- Vol.5 iPaaS
- Vol.6 API
- Vol.7 XaaS(SaaS、PaaS、IaaSなど)
- Vol.8 サーバレス(FaaS)
- Vol.9 MFT(Managed File Transfer)
- Vol.10 ファイル連携
- Vol.11 サイロ化
- Vol.12 疎結合
- Vol.13 SaaS
- Vol.14 PaaS
- Vol.15 IaaS
- Vol.16 オンプレミス
- Vol.17 マネージドサービス
- Vol.18 セルフサービスBI(ITのセルフサービス化)
- Vol.19 スケーラブル(スケールアップ/スケールダウン)
- Vol.20 エラスティック(弾力性・伸縮自在)
- Vol.21 PCI DSS
- Vol.22 GDPR(EU一般データ保護規則)
- Vol.23 SOC(System and Organization Controls)
- Vol.24 CCPA(カリフォルニア州消費者プライバシー法)
- Vol.25 シングルサインオン(SSO:Single Sign On)
- Vol.26 マイクロサービス(Microservices)
- Vol.27 スモールスタート(small start)
- Vol.28 API基盤・APIマネジメント
- Vol.29 REST API(Representational State Transfer API)
- Vol.30 クラウド連携
- Vol.31 SaaS連携
- Vol.32 Excel連携
Vol.1「ETL」
データ活用やDX成功に必要な考え方を、各種するキーワードの解説で理解できる用語解説集です。
今回は「つなぐ」技術の一種である「ETL」について解説をします。
ETLとは
ETL(イーティーエル)とは、Extract/Transform/Loadを略した言葉です。ITシステムやクラウドなどの様々なデータソースからデータを抽出(Extract)し、必要なデータ変換処理(Transform)を行い、他のシステムにデータを流し込む(Load)、「データ連携」での一連のデータの流れのこと、あるいはそれを実現するソフトウェアツール(ETLツール)のことをそう呼びます。
昨今、データやITの活用、あるいはクラウドの導入や活用においても、重要な役割を果たすツールとして注目をされています。
ETLが生まれた経緯(「どうしてそんなツールが必要になったか?」)
例えば、新たにデータ活用に取り組もうと思ったとします。分析技術やBIツールでの可視化、あるいは機械学習の活用などをイメージして、取り組もうと思うかもしれません。
そのようなツールの整備に意識が行きがちなのですが、実際にはその前提としてデータがないとデータ活用はできません。さらには、データは社内のあちこちに散在していることが多く、まずその前に必要なデータを集めないとやりたいことは何もできない、というのが現状だったりします。さらには、データを単に集めるだけではダメで、データの形式を揃えたりする加工も必要になってきます。
このようなデータ活用の前に必要になる「必要なデータをあちこちから取ってくる」作業を効率的し、データ活用をスムーズかつ柔軟にする手段がETLツールになります。
データ活用で一般的に発生しがちな問題
データを集めてくる必要はあるけれど、専用ツールが必要なほどなのかな?と思った人もおられるかもしれませんが、データ活用では一般的に発生しがちな問題であり、分析作業自体ではなくデータの準備に大半の時間がかかっているようなことはよくあることです。
データ活用実現にはさまざまな取り組み方がありますが、例えば「社内データ基盤」としてDWHやデータレイクなど「分析用のデータを溜めておく場所」を用意する取り組み方が伝統的にはよくある方法です。DWHの導入を行って社内データ基盤としました、これでデータ分析は存分にできるようになったはずでした。しかしデータ活用がどうもうまく進みません。 どうしてなのか調べてみると、分析作業そのものではなく、データを集めてくること、データを利用できる形に加工する作業に大半の手間がかかっていることがわかります。それでは困りますよね?そこで、そういう手間を効率化する手段として作られたのがETLツールになります。
またこれを読んでいる皆さんにおいても、データを集計してレポートを作成するような状況で、あちこちからデータを取ってきて、Excelに貼り付けてうんざりするような前作業をするようなことはありがちがと思いますが、これも同種の問題になります。
クラウド活用やDX実現の手段としての昨今の期待
ETL(やEAIやiPaaS)などのデータ連携ツールは、昨今のIT利活用の取り組みにおいても、クラウド活用やDX実現の手段として注目されています。
ETLはもともと、(上記の説明のように)DWHに分析に必要なデータを流し込む手間を何とかするために生まれましたが、「データを連携したい」は多くの分野の様々な状況で発生しているニーズでした。
例えばクラウドを導入して活用しようと考えた際にも、「クラウドの外側」とのデータ連携が必要になることがあります。データ連携ツールがない場合、利用クラウドごとに社員データがバラバラで不便になったり、なにかあるたびにクラウドからデータをダウンロードしたりアップロードしたりで多くの手間が発生していることがよくあります。
また様々なクラウドを組み合わせて活用しようとすると、クラウド連携を実現する手段も必要になってきますが、こちらで必要になるのも「つなぐ」ツールになってきます。
業務の現場が自分で使えるようなデータ連携ツールが必要
ETLの考え方そのものは様々な手段で実現できます。通常のプログラミングによって作り込むこともできますし、簡易なツールでともかくもデータを連携させて済ませることもできます。
しかしながら、「高い開発生産性」や「業務の基盤を担えるだけの本格的な性能」「業務の現場が自分で使える使いやすさ」はこれからのデータ活用にとって重要なことではないかと考えます。
高い開発生産性
ETLはデータ活用において手間がかかることをどうにかするために生まれました。手作業でのデータの出し入れや、プログラミングでのシステム開発で解決して特に問題ない程度なら、専用ツールは作られなかったでしょう。それ以上が実現できなければいけません。
業務の基盤を担えるだけの本格的な性能
実務でしっかり利用するのであれば、沢山のデータでも高速に処理できる十分な処理性能が必要になります。分析用のデータは大きなサイズになることがよくありますし、何年も運用を続けてデータ量が増えてきた時にも困らないだけの処理性能が必要です。 また業務を支える基盤として、安定稼働すること、ハードウェアの故障での異常終了など不測の事態があってもデータが壊れたりせずきちんと復旧できる、プロフェッショナルユースの水準で作られているソフトウェアであることも望まれます。
業務の現場が自分で使える使いやすさ
データ活用をうまくすすめるためには、現場での気付きを素早く反映できる仕組みがあるかどうかが、成果が出るかに大きく関わってきます。なにかあるごとに書面で必要事項を書き起こして外注していたら時間がかかってしまいます。どのデータがどのような形式で必要かを一番知っている「現場の人達が自分たちで使いこなせる」ことが望まれます。 そのためには、簡易なツールではない本格的な利用もできるポテンシャルを持ちつつ、GUI上でノーコード開発できることが望まれます。
関係するキーワード(さらに理解するために)
DataSpiderの評価版・無料オンラインセミナー
セゾンテクノロジーが自社で開発販売しているデータ連携ツール「DataSpider」は、ETLとしての機能も備えており、多数の利用実績もあるデータ連携ツールです。
通常のプログラミングのようにコードを書くこと無くGUIだけ(ノーコード)で開発でき、「高い開発生産性」「業務の基盤(プロフェッショナルユース)を担えるだけの本格的な性能」「業務の現場が自分で使える使いやすさ(プログラマではなくても十分に使える)」を備えています。 データ活用のみならず、クラウド活用などの様々なIT利活用の成功を妨げている「バラバラになったシステムやデータをつなぐ」問題をスムーズに解決することができます。
無料体験版や、無償で実際使ってみることができるオンラインセミナーも開催しておりますので、ぜひ一度お試しいただけますと幸いです。
用語集 コラム一覧
- Vol.1 ETL
- Vol.2 DWH
- Vol.3 データレイク
- Vol.4 EAI
- Vol.5 iPaaS
- Vol.6 API
- Vol.7 XaaS(SaaS、PaaS、IaaSなど)
- Vol.8 サーバレス(FaaS)
- Vol.9 MFT(Managed File Transfer)
- Vol.10 ファイル連携
- Vol.11 サイロ化
- Vol.12 疎結合
- Vol.13 SaaS
- Vol.14 PaaS
- Vol.15 IaaS
- Vol.16 オンプレミス
- Vol.17 マネージドサービス
- Vol.18 セルフサービスBI(ITのセルフサービス化)
- Vol.19 スケーラブル(スケールアップ/スケールダウン)
- Vol.20 エラスティック(弾力性・伸縮自在)
- Vol.21 PCI DSS
- Vol.22 GDPR(EU一般データ保護規則)
- Vol.23 SOC(System and Organization Controls)
- Vol.24 CCPA(カリフォルニア州消費者プライバシー法)
- Vol.25 シングルサインオン(SSO:Single Sign On)
- Vol.26 マイクロサービス(Microservices)
- Vol.27 スモールスタート(small start)
- Vol.28 API基盤・APIマネジメント
- Vol.29 REST API(Representational State Transfer API)
- Vol.30 クラウド連携
- Vol.31 SaaS連携
- Vol.32 Excel連携
まずは無料で「つなぐ」をご体験ください
DataSpider Servistaのデータ連携を、まずはお確かめください。30日間無料でお試しいただけます。
DataSpider Servistaの「つなぐ」を体験できる製品紹介・オンラインセミナーを開催しています。