DX推進の重要ポイント!
データインテグレーションの価値とは
新型コロナウイルス流行以降、企業や官公庁をはじめとした組織では業務効率化の推進が加速しており、その中でデータの管理・活用におけるご相談を多くいただきます。
ご相談いただく内容は多岐にわたりますが、一言で表すと「組織内でデータが散在し、適切に活用されていない」ケースが多いようです。このような課題に向き合うために今回はデータ連携の観点からなぜデータ連携が必要なのか、なぜデータ連携ツールが必要なのか、なぜデータ連携基盤が必要なのか3つのステップに分けてご紹介しデータインテグレーションの価値について知っていただきたいと思います。
Shinnosuke Yamamoto -読み終わるまで4分
ステップ1. なぜデータ連携が必要なのか?
そもそも、なぜ企業はデータ連携を行うのでしょうか?企業活動においてデータ連携が必要である状況、すなわち、複数のシステムで同一のデータが必要となるケースを考えてみます。
ケース① マスタデータの連携
同じデータを複数のシステムで使いまわすための連携
従業員に関するデータや部門に関するデータなど企業の基本的な情報であるマスタデータは、複数のシステムにおいて共通して必要です。例えば従業員マスタは、一般に人事情報システム上で管理される場合がありますが、経費精算や給与・労務システムを別に使用する場合には人事情報システムのデータ連携が必要になります。
ケース② 業務フローにおける連携
データを後続のプロセスに受け渡すための連携
例えば製造業における販売管理業務を例に挙げると、受注管理、出荷管理、請求管理、在庫管理などの様々な業務システムが関わります。これらのシステムの間には順序関係があり、受注管理で発生した注文データは、販売管理業務プロセスが進むごとに他のシステムでも必要になります。
ケース③ データ分析における連携
分析対象のデータを集め・返すための連携
一般にデータが発生するシステムとデータを分析するためのシステムは異なります。データを分析するには、そのデータを発生元のシステムから収集する必要があります。また、データの分析結果を発生元のシステムに反映すること(=リバースETL)も考えられるでしょう。
このように、企業活動において同一のデータを複数のシステム間で共有して使用するケースは往々にして考えられます。
ステップ2. なぜデータ連携ツールが必要なのか?
STEP1ではデータ連携が必要となるケースを3つご紹介しました。
では、これらのデータ連携を人の手で作業すると実際の業務にどのような影響があるのでしょうか。主に2つの影響があると考えられます。
「業務負荷の発生」
例えば従業員マスタの場合、入社/退職が発生するたびにマスタが更新され、その都度従業員マスタを使用するすべてのシステムにも手動で更新作業をかけなければなりません。
「データ品質の低下」
前者のようなデータの更新時に他システムへの反映漏れがあることで業務に誤りが発生し、分析時に正しい分析結果を導くことができない恐れがあります。
このような課題を回避するためデータの連携には、一般にEAI (Enterprise Application Integration) または ETL (Extract, Transfer, and Load) と呼ばれるようなデータ連携ツールが求められます。企業活動におけるデータ連携の必要性と人的データ連携の弊害に対し、データ連携ツールは「自動化」と「品質向上」の観点から支援を行います。
自動化という観点では、データがデータ連携ツールという機械的な仕組みにより、データの移動や連携先システムに合わせた変換といった作業の必要性がなくなります。品質向上という観点では、連携漏れや変換ミスといった人為的なデータの破損を防ぐことができます。ETL機能を有する連携ツールであれば、欠損データを除去するようなロジックの整備を通じて、データの品質を向上し・担保するような仕組みを作ることも可能となります。
ステップ3. なぜデータ連携基盤が必要なのか?
データ連携の仕組みを導入することで、業務効率の向上やデータ品質の担保の実現が可能であることが分かりました。
しかし闇雲にデータ連携の仕組みを導入することは得策ではありません。そこで当社では「データ連携基盤」の導入を推奨しています。まず、基盤化されていないデータ連携のケースを考えてみます。
ケース① SaaSの導入ごとにデータ連携ツールを導入
大企業であれば数十・場合によっては百を超えるSaaSを採用している場合があります。またSaaSが特定の業務に特化したものであれば、その導入は特定業務の担当部門ごとに進められるため、データの連携手段も導入部門ごとに選択されます。その結果、ひとつの企業の中でもデータの連携手段が多岐に渡り、属人化・属ベンダ化による開発効率・運用効率の非効率化や、部門内で仕組みが閉じた状態であるデータサイロを引き起こすことが考えられます。
ケース② データ連携が基幹業務システム(ERP)の仕様に依存
基幹業務システムの導入を支援するERPコンサルタントがデータ連携領域に精通していない場合、基幹業務システムを主として基幹業務システム側の仕様に強く依存したインターフェースを構築する可能性があります。特定の業務システムに強く依存したデータ連携の仕組みを採用する場合、その中核となる業務システムの仕様変更によって広範囲に改修影響が及び費用が膨張する恐れや、新たなシステム間データ連携への拡張が困難になる恐れがあります。
「データ連携基盤」でこれらの弊害を防ぐ
上記のようなケースに対して、企業内のデータ連携の仕組みをある単一の仕組みで統一する当社の「データ連携基盤」の考え方は、「ハブアンドスポーク方式」と「疎結合」という特性により、以下のように弊害を回避します。
特性① ハブアンドスポーク方式
ハブアンドスポーク (Hub & Spoke) 方式は、その名の通りデータ連携基盤を中心(=ハブ)に、データ連携の対象となる業務システムを周辺(=スポーク)に位置付けるアーキテクチャです。あらゆるデータ連携は、すべてデータ連携基盤を経由して行われるために、データ連携によって必要なスキルセットが異なる属人化を排除します。また、データ連携基盤はある特定の業務部門に限定されたものではなく全社の基盤であるために、部門の垣根を越えてデータサイロ(=データが業務部門ごとに分散して閉じている状態)を解消します。
特性② 疎結合
疎結合は、連携する業務システム同士の間にデータ連携基盤が介在することによって、各業務システムの独立性を高く保つ状態を指します。具体的には、ある業務システムにおいて何らかの変更があった場合に、データ連携基盤でその影響を吸収し他の業務システムに影響が出ないようにします。業務システム間の連携は疎結合であるために、例えば新たなSaaSを導入したいとしても、他の業務システムへの影響を気にせず導入することができます。すなわち、拡張性の確保を実現します。
データ連携基盤の導入によるデータとインターフェースの集約化を、我々は総称してデータインテグレーションと呼んでいます。
まとめ
今回はデータ連携の観点から、データ連携の必要性・データ連携ツールの必要性・データ連携基盤の必要性についてお話しました。
- マスタ連携や業務フローの実現、データ分析のためにデータを連携する必要があるものの、手動で連携すると業務量が膨大かつ煩雑となり、データの品質が低下するなどの問題が発生する。
- データ連携ツールを導入し、データ連携の自動化とデータの品質向上を実現する。
- データ連携の属人化やデータサイロの発生を抑止するためハブアンドスポーク型のデータ連携基盤を導入して疎結合なアーキテクチャを作り、属人化の排除やデータサイロ解消、拡張性を確保する。
データ連携についてご理解いただけたでしょうか?
次回は、データ連携を行っていくうえで重要な考え方である「データ連携の標準化」についてお話したいと思います。
執筆者プロフィール
山本 進之介
- ・所 属:データインテグレーション営業統括部 AIエバンジェリスト
- 入社後、データエンジニアとして大手製造業のお客様を中心にデータ基盤の設計・開発に従事。その後、データ連携の標準化や生成AI環境の導入に関する事業企画に携わる。2023年4月からはプリセールスとして、データ基盤に関わる提案およびサービス企画を行いながら、セミナーでの講演など、「データ×生成AI」領域のエバンジェリストとして活動。趣味は離島旅行と露天風呂巡り。
- (所属は掲載時のものです)
おすすめコンテンツ
データ活用コラム 一覧
- データ連携にiPaaSをオススメする理由|iPaaSを徹底解説
- システム連携とは?自社に最適な連携方法の選び方をご紹介
- 自治体DXにおけるデータ連携の重要性と推進方法
- 生成 AI が切り開く「データの民主化」 全社員のデータ活用を阻む「2つの壁」の突破法
- RAG(検索拡張生成)とは?| 生成AIの新しいアプローチを解説
- Snowflakeで実現するデータ基盤構築のステップアップガイド
- SAP 2027年問題とは? SAP S/4HANAへの移行策と注意点を徹底解説
- Salesforceと外部システムを連携するには?連携方法とその特徴を解説
- DX推進の重要ポイント! データインテグレーションの価値