データ活用コラム

データは分散管理の時代?データメッシュを実現する次世代データ基盤とは

企業におけるIT活用の進展に伴い、企業が持つデータの量は増大し、その形式は様々に複雑化しています。こうした変化に伴い、従来主流とされてきたデータを一箇所で集中的に管理するというアプローチに対し、データを分散させたまま管理すべきであるという考え方が登場しました。
本記事では「データメッシュ」の考え方を例に、次世代データ基盤のあるべき姿について解説します。

データ基盤

データ活用

Shinnosuke Yamamoto -読み終わるまで7分

データの分散管理:データメッシュとは何か

データメッシュとは、データを一箇所で集中管理するのではなく、分散したまま管理するという近年唱えられている新たなデータ管理手法です。

データメッシュには、ドメインごと、つまり業務単位ごとにデータを管理・活用するという思想が根幹にあります。各部門が自身のデータに責任を持ち、素早いデータの活用と意思決定を実現できると期待されています。

データメッシュの特徴とも言える四つの原則を見ていきましょう。

原則1: 現場主導のオーナーシップ

データを所有する部門は、そのデータがどのように生成され、どんなビジネス価値を持つのかを最もよく理解しています。そのため、利用者からの問い合わせやメンテナンスの対応も迅速かつ的確に行いやすいという利点があります。また、現場部門が自部門のデータを整備し、アクセス制御や公開ルールを設定して全社的に共有できる体制をつくることが理想とされます。これにより、中央部署を経由することなくデータが流通し、ビジネスのスピードを維持しながらデータ活用が進められます。

ただし、その部門だけがデータを抱え込みすぎると、他部門が活用できないという弊害が生まれます。データメッシュでは、所有者としての責任を果たしながらも、必要に応じてほかのドメインとデータを共有する仕組みが求められます。また、ルールを統一しなければすぐにデータが部分最適に陥り、全社での再利用性を損なうリスクもあるため、横串となるガバナンス体制の整備が欠かせません。

原則2: プロダクトとしてのデータ

データメッシュでは、データを単なる業務の副産物ではなく、ユーザーにとって価値ある成果物、すなわちプロダクトとして位置付けます。プロダクトである以上、品質や使いやすさ、提供形態などが明確に定義され、ユーザーが容易に利用できるようドキュメント化が求められます。

具体的には、データの所有者はデータ利用者の視点に立ち、ドキュメントやサンプルクエリ、利用時のベストプラクティスなどを整備することが求められます。また、APIを通じてデータにアクセスできる形にすることで、誰が利用しても一定の品質でデータを取り扱えるようになるでしょう。

これにより、データを活用する担当者が最適な判断材料を得やすくなり、ビジネス発展につながる洞察を得られるようになることが期待されます。データのプロダクト化は同時に、持続的にデータ品質を改善する文化を根付かせるための推進力にもなります。

原則3: セルフサービス型の基盤

データを活用したいと考える業務現場の担当者やデータサイエンティストは、データの所属部門やシステムを細かく把握するよりも、必要に応じてすぐに取り出せる仕組みを望む傾向にあります。利用者が必要なデータを自由に検索・アクセスできれば、ビジネス現場のスピード感を落とさずに分析や施策の立案が可能です。

セルフサービスを成立させるためには、データ提供者がAPIを公開し、利用者側がスムーズにデータを取得できる環境を整えることが大切です。公開されたAPIは常にモニタリングされ、品質評価や稼働状況が可視化されている状態が理想とされます。また、データに関わる情報を一元的に管理するデータカタログにより、どのAPIがどんなデータを提供しているかを一覧できるため、部門間の連携が一段と容易になるでしょう。こうした仕組みを整備することで、企業全体としてデータが活用される基盤が整うのです。

原則4: 横断的なガバナンス

分散管理の大きなリスクの一つが、データが再びサイロ化してしまうことです。各部門が独自の命名規則や品質基準を使い始めると、横断的な連携が難しくなるでしょう。たとえ各部門がデータを所有していても、統一されたフォーマットやセキュリティルールを設けることで、データの再利用や品質確保が容易になります。

各部門がそれらの標準に従うことで、データの統合や相互利用がスムーズになり、重複開発や誤加工を極力減らすことが期待できます。こうした標準化は中央集権的な管理を意味するものではなく、あくまで分散管理を支援するための共通言語の整備と考えるとよいでしょう。最終的には、各部門が自律的にデータを公開しながらも、全社レベルで一貫した活用が可能になるという利点があります。

データメッシュ台頭の背景:集中管理の限界

データメッシュが登場した背景には、従来のデータ管理における様々な課題があります。企業が扱うデータは日々増え続け、その種類も多様化しています。このような状況で、データの一元的な集中管理では対応しきれない問題が顕在化してきました。

img_column_data-utilization-data-mesh_01.png

データサイロと散在するデータ

企業内では、組織やシステムが分断されているためにデータがデータサイロの状態に陥りがちです。顧客データは営業部門、商品データは生産管理部門など、データの内容によって管理部門が異なることが一般的です。さらに、同じ種類のデータであっても、複数の部門にまたがって管理されているケースも珍しくありません。

また、データはオンプレミス、クラウド、SaaSなど、様々なシステム環境に散在しています。これにより、部門間やシステム間でのデータ共有には都度調整が必要となり、データ形式の加工やセキュリティ要件の考慮など、多くの手間が発生します。結果として、必要なデータを迅速に活用することが難しくなります。

集中管理アプローチの限界

これらの課題を解決するため、これまでデータレイクやデータウェアハウスといった、データを一箇所に集約する集中管理のアプローチが採用されてきました。

  • データレイク:形式を問わず大量のデータを一時的に蓄積し、柔軟な分析や機械学習に活用することを目的とします。
  • データウェアハウス:様々なシステムから収集したデータを整形・統合し、分析に特化した形式で保存することで、BIツールなどを用いた迅速なレポート作成を可能にします。

しかし、データを一箇所に集めるだけでは新たな問題が生じることがあります。膨大なデータが適切に管理されずに蓄積されると、必要なデータを見つけるのが困難になるデータスワンプと呼ばれる状態に陥ります。データの品質が低く、重複や更新の不整合が発生すれば、実用性が著しく低下してしまいます。

加速するデータ増加への対応困難

現代のビジネス環境では、AI、IoT、外部連携などにより、企業が扱うデータの種類と量は加速度的に増加しています。これにより、従来の集中管理アプローチでは、巨大化するデータ基盤を常にメンテナンスし、全社統一のデータモデルを維持することが極めて困難になっています。専門知識や運用リソースも限られている中で、スピードと柔軟性が求められるデータ活用に対応しきれない状況が生まれてきたのです。

このような集中管理の限界が、データメッシュという新たなアプローチが注目される大きな要因となっています。

データメッシュを見据えたデータ基盤のポイント

企業がデータメッシュを導入する際には、単にツールやクラウドプラットフォームを導入するだけでなく、運用体制やガバナンスの設計が欠かせません。特に、部門ごとのオーナーシップをどのように権限委譲し、どのようにデータ品質基準を統一するかは大きなチャレンジとなります。ここでは、iPaaSやノーコードツール、データカタログなど、分散管理を支える主要なテクノロジーについて考えていきます。

iPaaSでデータを統合する

iPaaS(Integration Platform as a Service)は、複数のシステムやアプリケーション間のデータ連携を一元的に管理するためのクラウドサービスです。各システムが持つAPIやコネクタを組み合わせることで、データの抽出・変換・ロードを自動化しやすくなります。これにより、従来は個別に構築していたETLやELTの仕組みをシンプルに整理でき、ガバナンスにも対応しやすくなります。データメッシュの環境下では、部門間を橋渡しする重要な基盤として、iPaaSが大きな役割を果たします。

標準化された共通のインターフェース環境

部門ごとに異なるETLツールを導入すると、データの変換処理やジョブ管理が分断され、統一した運用管理が困難となります。これにより、同じデータセットに対して複数の変換ロジックが生まれ、結果の整合性が取れなくなるリスクが高まります。

共通のインターフェース環境でインターフェースの標準化と部品の共通化を行うことで、データの取得や更新手順をシステム横断で統一できるため、セキュリティレベルやデータ品質基準を全社で一律に保ちやすくなります。また、共通化された部品を使うことで新たなシステムとの連携がスムーズに行え、ビジネスの変化に迅速に対応できます。

データ活用が進むほど、システム間のインターフェースの数や種類が増大し、管理コストも膨らみます。標準化されたインターフェースを設けることで、部門ごとに異なるツールを導入したとしても、データ連携の手間を最小限に抑えることができます。

ノーコードによる現場主導のインターフェース整備

ノーコードツールを活用すれば、プログラミングの知識が乏しい業務担当者でもデータ連携やAPIの設定を行いやすくなります。現場担当者がデータ連携を自分たちで組めると、要件定義から実装までのリードタイムが大幅に短縮されます。ITリソースが限られる中でも、部門独自のツールやデータを迅速に利用環境へ反映しやすくなるでしょう。

また、ノーコードで部門ごとに持つデータをAPI形式で公開できれば、他部門や外部パートナーとの連携がスムーズになります。利用側はプログラミング言語やBIツールを問わずAPI経由でデータを取得できるため、技術スタックの違いを意識する必要がありません。これにより、ビジネスユーザーが分析ダッシュボードを素早く作成したり、外部サービスと自動連携したりするなど、データ活用の幅が大きく広がります。

同時に、標準化されたテンプレートやガイドラインを提供することで、無秩序な開発やセキュリティリスクを最小限に抑えることができます。データメッシュの原則である「現場主導のオーナーシップ」を実践しつつ、全社的な統制も保つことができます。

データカタログでデータを一元管理する

分散されたデータ資産を効率的に扱うには、どの部門がどんなデータを所有しているのかを可視化する仕組みが必要です。データカタログを導入すれば、メタデータや所有者情報、アクセス方法などを一箇所に集約し、利用者が容易に検索・参照できる環境を作り出せます。データメッシュでは、実際のデータそのものを中央に集約しない代わりに、このカタログを「分散管理の情報ハブ」として活用します。

データメッシュでのデータの探索

企業の事業規模が大きくなるほど、データを持つ部署や使用するシステムは増え、管理体制も複雑化します。データメッシュでは、そうした状態を前提とし、あえて物理的な統合を行わずにガバナンスを効かせる戦略を取ります。

業務現場ごとにデータが所有されている状態では、必要な情報を見つけ出すのに手間がかかりそうに思われがちです。そこで、データカタログを全社的な辞書として位置付け、誰でも簡単に欲しいデータを検索できるようにしておくことが重要です。

これにより、分散管理がもたらすスピード感と柔軟性を損なうことなく、全社的なデータ活用にも支障が出ない体制が整います。

データカタログとは

データカタログは、企業内外に散在するデータのメタ情報を集約・管理し、必要な人が必要なときにアクセスしやすくするソリューションです。テーブル構造やカラムの意味、データ所有者や使用事例などが登録されることで、組織全体のデータ資産を俯瞰できるようになります。

データカタログを使うことで、データの物理的な保管場所や所有者が異なっていても、論理的には一元管理した状態を実現できます。これはデータを中央に集めるのではなく、あくまで利用者がデータの存在と内容を容易に把握できるようにする仕組みです。現場部門がオーナーシップを持ち続けながらも、全社のだれもが必要とするデータにアクセスしやすくなるため、データ活用の効率と質が大幅に向上します。

データカタログを介して必要なデータを見つけた利用者は、APIやETLツールを使い、自由にデータへアクセスすることができます。これによってボトルネックとなる承認フローや問い合わせ対応が大幅に減り、単なる数字合わせではなく、より戦略的なデータ活用に時間を割けるようになります。

まとめ

ビジネス環境が高度化・多様化する今、データメッシュのような分散管理が注目を集めています。現場主導のオーナーシップやプロダクト志向、セルフサービス基盤などを組み合わせることで、スピードと柔軟性を兼ね備えた新しいデータ活用体制を築くことが可能です。

ノーコードのiPaaSやデータカタログは、分散状況でもガバナンスを維持しやすいデータメッシュ的なアーキテクチャの整備に役立ちます。今後もデータの爆発的な増加と活用シーンの急速な拡大が見込まれる中、この分散管理型のアプローチは多くの企業にとって欠かせない選択肢となっていくでしょう。

執筆者プロフィール

山本 進之介

  • ・所 属:データインテグレーションコンサルティング部 Data & AI エバンジェリスト
  • 入社後、データエンジニアとして大手製造業のお客様を中心にデータ基盤の設計・開発に従事。その後、データ連携の標準化や生成AI環境の導入に関する事業企画に携わる。2023年4月からはプリセールスとして、データ基盤に関わる提案およびサービス企画を行いながら、セミナーでの講演など、「データ×生成AI」領域のエバンジェリストとして活動。趣味は離島旅行と露天風呂巡り。
  • (所属は掲載時のものです)

おすすめコンテンツ

HULFT DataCatalog

HULFT DataCatalog

散在したメタデータを収集・整理・カタログ化。データ探索の効率化とデータの“中身”に関する理解を支援

製品詳細ページを見る

メタデータとは?基礎から最新動向まで徹底解説

メタデータとは?基礎から最新動向まで徹底解説

メタデータに関する情報をまとめました。組織全体でメタデータを一貫して管理する体制を整え、効率的な情報活用の実現にお役立てください!

詳細ページを見る

HULFT Square サービスサイト

iPaaS型データ連携基盤 HULFT Square

AI時代に注目が集まるデータ連携基盤のiPaaS。そんな時代のニーズに応える「HULFT Square(ハルフトスクエア)」の製品詳細をご確認ください。

製品詳細ページを見る

データ活用コラム 一覧

データ活用コラム一覧

Change Location

Are you visiting HULFT.com (Japanese language) outside Japan ?
When connecting "HULFT" to Japan from overseas, please select "HULFT8".

日本国外からHULFT.com(日本語)にアクセスされようとしています。
海外から日本の「HULFT」と接続する製品をお探しの場合、「HULFT8」をお選びください。