データ活用やDXがどんどん解る用語集
オープンデータ(open data)
「オープンデータ(open data)」
データ活用やDX成功に必要な考え方を、各種キーワードの解説で理解できる用語解説集です。
今回は、世の中全体でのデータ活用や、IT時代の自治体と住民の新しい関係においてこれから重要になる新しいデータの考え方について紹介します。
オープンデータ(open data)とは
オープンデータ(open data)とは、データを自由に利用できるようにして公開することで、データ活用が広く行われるようにする取り組みのことです。
世の中には公的機関などが作ったデータが沢山ありますが、インターネット登場以前には社会で十分に活用されていませんでした。そのようなデータをネットで公開し、社会で広く利用され役立てられるようにする取り組みが行われるようになり、そのような取り組みで公開されているデータとして、オープンデータが広く知られるようになりました。
目次
公的機関が持っているデータを社会で活用するには
オープンデータと聞くと、どのようなイメージがあるでしょうか。ネットに公開されているデータで無料利用できるもの、というような理解が多いかもしれません。オープンデータとは、単にデータが公開されていることのみならず、データの利用制限が無いなど「オープン(自由)に利用できるように配慮して公開されているデータ」のことをそのように呼びます。
またオープンデータは、これから世の中全体のIT化が進む今後において、データが活用されている社会を実現するために重要な「考え方」のことであり、我々が今後データを活用してデータ分析などに取り組みにあたっても、あるいはデータが活用される状況を整備するにあたっても、これから重要になると思われる考え方です。
公的機関にある大量のデータ
IT化が進むよりも前から、省庁や自治体などの公的機関には多くのデータがありました。例えば国土地理院が日本全土を測量して地図を作っています。国勢調査などの公的な調査によって、日本のどこにどのような人(性別や年齢など)が何人住んでいるのかも集計されています。社会的な調査結果以外にも、科学的な調査の結果(例えば、気象観測や海洋調査、宇宙探査の結果)など、多くのデータがあります。
それらデータの中には、民間での利活用においても役に立つデータも多々あります。わかりやすいところでは「地図のデータ」や「天気の予報」は多くのことで役に立ちますし、例えば「この駅の付近にはどんな年齢と性別の人が住んでいるか」のデータを参照できれば自社の商品がどの地域で売れそうかの判断材料にできるなど、役に立てることができるデータが沢山あります。
それらのデータは日本国民の税金で作ったデータであって、作ったデータをただ保管しているよりも、データが広く日本国民や日本の発展のために役に立てられている方が望ましいはずです。そうであるならば、そのデータにプライバシーなど公開すべきではない事情がない限り、広く公開され活用されることが望まれるはずです。
さらには、「公的機関だからこそ用意できるデータ」が社会の発展に必要になることがあります。日本全土の調査など大規模過ぎる活動が必要になるなど「公共機関でなければ作れないようなデータ」もありますし、「中立性や信頼性のある公的機関が提供しているデータ」であることで、皆が信頼して利用できて社会活動の共通の基盤として利用されることが有用なこともあります。
インターネット経由での公開
公的機関が作った有用なデータはずっと前からありましたし、世の中で活用できるように公開もされていました。しかし、IT時代になる前は紙媒体での公開であることが多く、公開されているとは言ってもなかなか手軽に利用できる状態ではありませんでした。
しかし今ではインターネットがあります。公的機関が持つデータのデジタル化を進め、ネット経由で公開すれば、かつてとは比較にならないくらい多くの人がデータを利用することができます。21世紀になったころから、「公的機関の持つデータをインターネットで原則公開する」取り組み運動が世界的に進められるようになります。そして、そのような取り組みのことを「オープンデータ運動」、公開されたデータのことを「オープンデータ」と呼ぶようになってきます。
日本においても2010年代になってからは、政府や各自治体でオープンデータの考え方が広く知られて取り組みが進められるようになり、今では多くのデータが公開され利用できるようになってきています。
これからのデータ活用でのオープンデータ
現在、ビジネスにおいてもデータ活用への取り組みが大変に盛んです。データ活用というと社内でデータを集めて分析するような取り組みがまず思い浮かびますが、ビジネスでのデータ活用においてもオープンデータ活用は重要です。
ビジネスは自社だけで行うものではなく、顧客やマーケットについて理解する必要、すなわち「世の中」について理解する必要があります。公的機関が作ったデータとはまさに「世の中についてのデータ」です。例えば、日本に住んでいる人々について知りたいのなら、あるいは各産業分野で日本経済がどうなっているかを知りたいのなら、自社独自のデータ収集では不可能な量と精度のデータを、オープンデータから得ることができるはずです。
未来を実現するために必要なオープンデータ活用
これから先の時代、IT化が進み都市全体がデジタル化された未来を想像するなら、未来のインテリジェントな都市では「都市全体でデータが縦横無尽に活用されている」はずです。例えば交通機関の情報など都市内の移動に関する情報、天候、混雑状態、工事や事故などの都市の現在の状態など、多くのデータが都市全体で活用されているはずです。都市全体でデータが活用されている状態とは、数多くのデータがオープンデータとして公開され高度に活用されている状況であるはずです。
またオープンデータは、自治体にとって「住民との新しい関係」を実現する手段にもなります。
まず、データの公開は行政の透明化や効率化を実現する手段になります。世の中の状況がデータで公開され、公的機関が行っていることが公開さていれば、行政が行っていることが適切であるのかどうか、住民が自らデータを用いて判断できるようになってきます。
また「行政のデジタル化」の実現手段としても従来とは違う考え方での取り組みが可能になってきます。
従来的な考え方ならば、自治体がインターネット上で様々な行政手続きができるようにWebサイト(や自治体独自のスマホアプリなど)の整備を進めるような取り組みがなされてきたと思います。しかしながら、そのような取り組み方では時間とコストがかかり、現実問題として自治体が作ったサービスは使いやすいものではないことも多々あると思います。
その代わりに、自治体は行政に関するデータの原本そのものをオープンデータ(あるいは行政に関連するAPI)として公開し、住民の側が公開されたデータを工夫して使うことで、行政と住民の新しい関係性が実現しえます。
例えば「ゴミ収集は何曜日なのか」ならば、自治体がWebサイト上に掲示するのが従来のやり方(利用者も使いづらくても我慢するしかない)であるとするなら、オープンデータとしてゴミ収集に関する生データを公開し、住民有志が作ったアプリでそのデータを読み込んで便利に利用するようなことが可能なはずです。住民は以前よりも便利になり、行政は行政コストを下げることができます。
自治体を超えてそのようなデータ公開が進んだなら、日本のどこでもスマホアプリを開けば、GPSからの位置情報で最寄りのゴミ収集場所がすぐわかり、ゴミを出す日、分別方法などを調べてくれるアプリすら実現可能になるはずです。このように行政はコストをかけることなく、住民はデータ活用を通じて行政に参加して世の中が便利になる可能性があります。
あなたのビジネスでもそのような未来が実現する可能性
このような「新しい関係性の可能性」は自治体に限られたことではありません。民間企業にとっても、オープンデータやAPIを通じての「取引先や顧客との新しい関係」は今後に広がる可能性であり、それを実現する手段として、自社でのデータ公開に取り組むことができるはずです。
しかしながら「バラバラ」なオープンデータ
多くの可能性があるオープンデータですが、実際に利用するにあたっては難しいこともあります。とにかくいろいろなことが「バラバラ」で、活用に手間がかかることが多いところです。
どのように「バラバラ」か
様々な組織が作ったデータが公開されたものですから、公開方法もデータ形式もデータの中身についても、それぞれバラバラです。Webページから手動でダウンロードする形での公開かもしれないし、API経由かもしれないし、FTP、HTTP経由、電子メールへのファイル添付といろいろな提供方法があり得ます。データの形式もExcelファイル、CSVファイル、XMLファイル、PDFファイルなど様々にありえます。
データを受け取った後も手間がかかります。同じデータを格納したExcelファイルでも作成者によって体裁がバラバラなのは良くあることです。データそのものについても、日本語文字コードの違い、日付データの形式の違い、和暦と西暦、単位の違う数値、数値がカンマ区切りかどうか、データの有効桁数の違い、円換算とドル換算、税抜き価格と税込み価格など多くの違いがありえます。
データ分析作業にあたって、多数のデータを参照して必要な部分を判断して集めてくる手間が必要になることもあります。例えば、市場予測のデータは「年度」でファイル分割されていて、天気予報のデータは「年」ごとでファイル分割されていて組み合わせて分析しようと思ったなら、ちょっと面倒だなと思うはずです。データがいつ時点のものか(全てが最新データとは限らない)確認するみたいな手間もあります。
オープンデータ活用の現実は「バラバラ」なデータの活用
つまりオープンデータ活用とは、インターネットのあちこちでそれぞれバラバラな方法で公開されているデータを集めてきて活用することとなります。本質的に違う事情を抱えている世の中の様々なところから出てくるデータだからこそオープンデータなので、バラバラであることを事前に解消するような取り組みも本質的に困難なはずです。
このためオープンデータを用いたデータ分析に取り組む前の「バラバラなデータ」にかかる手間、例えばデータがどのように格納されているかを調査あるいは解読する、用途に応じてデータ変換を行う、複数のデータを組み合わせるなどの「手間」が避けられないことが多く、これをどうするかが活用のポイントになることがあります。
オープンデータの活用で役に立つ「つなぐ」技術
つまりオープンデータを用いたデータ活用を推進するためには、「バラバラ」なデータをうまく処理できるデータ利用環境を整備し、必要なオープンデータを効率的に取得し、必要に応じてデータを加工変換などが実施できることが必要になります。
さらには、オープンデータを利用するようなデータ活用では、試行錯誤を経てのデータ分析が必要になることも多いはずです。別の視点でデータ分析を行おうとするたびに、毎回データの準備自体で手間と時間がかかってしまうなら、データ活用を深められなくなることも考えられます。
つまり、オープンデータの活用に取り組み、その可能性を生かすためには、そのようなバラバラなデータを効率よく収集し、スムーズかつ効率的に活用できるデータ基盤が整備されていることが望まれます。
「つなぐ」技術を活用ください
多種多様なシステムやクラウド上にあるデータに連携し、必要に応じでデータを読み取り、加工し、転送処理を行い、データ環境を整備する取り組みを、「GUIだけ」で効率的に開発できる手段が存在します。「EAI」や「ETL」、「iPaaS」と呼ばれる、「DataSpider」や「HULFT Square」などの「つなぐ」技術です。
GUIだけで利用できる
通常のプログラミングのようにコードを書く必要がありません。GUI上でアイコンを配置し設定をすることで、多種多様なシステムやデータ、クラウドサービスへの連携処理を実現できます。
「GUIで開発できる」ことは長所でもある
GUIだけでのノーコード開発は、本格的なプログラミングに対して簡易で妥協的な印象を受けるかもしれません。しかしながら、GUIだけで開発できることは「業務の現場の担当者が自分たち自身で主体的にクラウド連携に取り組む」ことを可能にします。ビジネスのことを一番良くわかっているのは現場の担当者です。
本格的処理を実装できる
「GUIだけで開発できる」ことを謳っている製品は沢山ありますが、そういう製品に簡易で悪い印象を持っている人もおられるかもしれません。
確かに、「簡単に作れるが簡易なことしかできない」「本格的処理を実行しようとしたら処理できずに落ちてしまった」「業務を支えられるだけの高い信頼性や安定稼働能力がなくて大変なことになってしまった」ようなことは起こりがちです。
「DataSpider」や「HULFT Square」は、簡単に使うこともできますが本格的プログラミングと同等のレベルの処理の作りこみもできます。内部的にJavaに変換されて実行されるなど本格的プログラミングと同様の高い処理能力があり、長年にわたって企業ITを支えてきた実績もあります。「GUIだけ」の良さと、本格的能力の両方を兼ね備えています。
iPaaSなので自社運用不要
DataSpiderなら自社管理下のシステムでしっかりと運用できます。クラウドサービス(iPaaS)のHULFT Squareなら、このような「つなぐ」技術そのもの自体もクラウドサービスとして自社運用不要で利用でき、自社での導入やシステム運用の手間がなく利用できます。
関係するキーワード(さらに理解するために)
データ連携やシステム連携に関係するキーワード
- EAI
- -システム間をデータ連携して「つなぐ」考え方で、様々なデータやシステムを自在につなぐ手段です。IT利活用をうまく進める考え方として、クラウド時代になるずっと前から、活躍してきた考え方です。
- ETL
- -昨今盛んに取り組まれているデータ活用の取り組みでは、データの分析作業そのものではなく、オンプレミスからクラウドまで、あちこちに散在するデータを集めてくる作業や前処理が実作業の大半を占めます。そのような処理を効率的に実現する手段です。
- iPaaS
- -様々なクラウドを外部のシステムやデータと、GUI上での操作だけで「つなぐ」クラウドサービスのことをiPaaSと呼びます。
「iPaaS」や「つなぐ」技術に興味がありますか?
オンプレミスにあるITシステムからクラウドサービスまで、様々なデータやシステムを自在に連携し、IT利活用をうまく成功させる製品を実際に試してみてください。
「つなぐ」ツールの決定版、データ連携ソフトウェア「DataSpider」および、データ連携プラットフォーム「HULFT Square」
当社で開発販売しているデータ連携ツール「DataSpider」は長年の実績がある「つなぐ」ツールです。データ連携プラットフォーム「HULFT Square」はDataSpiderの技術を用いて開発された「つなぐ」クラウドサービスです。
通常のプログラミングのようにコードを書くこと無くGUIだけ(ノーコード)で開発できるので、自社のビジネスをよく理解している業務の現場が自ら活用に取り組めることも特徴です。
DataSpider / HULFT Squareの「つなぐ」技術を試してみてください:
簡易な連携ツールならば世の中に多くありますが、GUIだけで利用でき、プログラマではなくても十分に使える使いやすさをもちつつ、「高い開発生産性」「業務の基盤(プロフェッショナルユース)を担えるだけの本格的な性能」を備えています。
IT利活用の成功を妨げている「バラバラになったシステムやデータをつなぐ」問題をスムーズに解決することができます。無料体験版や、無償で実際使ってみることができるハンズオンも定期開催しておりますので、ぜひ一度お試しいただけますと幸いです。
「HULFT Square」で貴社のビジネスが変えられるか「PoC」をしてみませんか:
貴社のビジネスで「つなぐ」がどう活用できるのか、データ連携を用いた課題解決の実現可能性や得られる効果検証を行ってみませんか?
- SaaSとのデータ連携を自動化したいが、その実現可能性を確認したい
- データ利活用に向けて進めたいがシステム連携に課題がある
- DXの実現に向けてデータ連携基盤の検討をしたい
用語集 コラム一覧
英数字・記号
- 2025年の崖
- 5G
- AES
- AI
- API【詳細版】
- API基盤・APIマネジメント【詳細版】
- BCP
- BI
- BPR
- CCPA(カリフォルニア州消費者プライバシー法)【詳細版】
- Chain-of-Thoughtプロンプティング【詳細版】
- ChatGPT(Chat Generative Pre-trained Transformer)【詳細版】
- CRM
- CX
- D2C
- DBaaS
- DevOps
- DWH【詳細版】
- DX認定
- DX銘柄
- DXレポート
- EAI【詳細版】
- EDI
- EDINET【詳細版】
- ERP
- ETL【詳細版】
- Excel連携【詳細版】
- Few-shotプロンプティング / Few-shot Learning【詳細版】
- FIPS140【詳細版】
- FTP
- GDPR(EU一般データ保護規則)【詳細版】
- Generated Knowledgeプロンプティング(知識生成プロンプティング)【詳細版】
- GIGAスクール構想
- GUI
- IaaS【詳細版】
- IoT
- iPaaS【詳細版】
- MaaS
- MDM
- MFT(Managed File Transfer)【詳細版】
- NFT
- NoSQL【詳細版】
- OCR
- PaaS【詳細版】
- PCI DSS【詳細版】
- PoC
- REST API(Representational State Transfer API)【詳細版】
- RFID
- RPA
- SaaS【詳細版】
- SaaS連携【詳細版】
- SDGs
- Self-translateプロンプティング /「英語で考えてから日本語で答えてください」【詳細版】
- SFA
- SOC(System and Organization Controls)【詳細版】
- Society 5.0
- STEM教育
- The Flipped Interaction Pattern(解らないことがあったら聞いてください)【詳細版】
- UI
- UX
- VUCA
- Web3
- XaaS(SaaS、PaaS、IaaSなど)【詳細版】
- XML
あ行
か行
- カーボンニュートラル
- 仮想化
- ガバメントクラウド【詳細版】
- 可用性
- 完全性
- 機械学習【詳細版】
- 基幹システム
- 機密性
- キャッシュレス決済
- 業務自動化
- クラウド
- クラウド移行
- クラウドネイティブ【詳細版】
- クラウドファースト
- クラウド連携【詳細版】
- 検索拡張生成(RAG:Retrieval Augmented Generation)【詳細版】
- コンテキスト内学習(ICL: In-Context Learning)【詳細版】
- コンテナ【詳細版】
- コンテナオーケストレーション【詳細版】
さ行
- サーバレス(FaaS)【詳細版】
- サイロ化【詳細版】
- サブスクリプション
- サプライチェーンマネジメント
- シンギュラリティ
- シングルサインオン(SSO:Single Sign On)【詳細版】
- スケーラブル(スケールアップ/スケールダウン)【詳細版】
- スケールアウト
- スケールイン
- スマートシティ
- スマートファクトリー
- スモールスタート(small start)【詳細版】
- 生成AI(Generative AI)【詳細版】
- セルフサービスBI(ITのセルフサービス化)【詳細版】
- 疎結合【詳細版】
た行
- 大規模言語モデル(LLM:Large Language Model)【詳細版】
- ディープラーニング
- データ移行
- データカタログ
- データ活用
- データガバナンス
- データ管理
- データサイエンティスト
- データドリブン
- データ分析
- データベース
- データマート
- データマイニング
- データモデリング
- データリネージ
- データレイク【詳細版】
- データ連携 / データ連携基盤【詳細版】
- デジタイゼーション
- デジタライゼーション
- デジタルツイン
- デジタルディスラプション
- デジタルトランスフォーメーション
- デッドロック/ deadlock【詳細版】
- テレワーク
- 転移学習(transfer learning)【詳細版】
- 電子決済
- 電子署名【詳細版】
な行
は行
- ハイブリッドクラウド
- バッチ処理
- 非構造化データ
- ビッグデータ
- ファイル連携【詳細版】
- ファインチューニング【詳細版】
- プライベートクラウド
- ブロックチェーン
- プロンプトテンプレート【詳細版】
- ベクトル化 / エンベディング(Embedding)【詳細版】
- ベクトルデータベース(Vector database)【詳細版】
ま行
や行
ら行
- リープフロッグ現象(leapfrogging)【詳細版】
- 量子コンピュータ
- ルート最適化ソリューション
- レガシーシステム / レガシー連携【詳細版】
- ローコード開発(Low-code development)【詳細版】
- ロールプレイプロンプティング / Role-Play Prompting【詳細版】
わ行
おすすめコンテンツ
まずは無料で「つなぐ」をご体験ください
DataSpider Servistaのデータ連携を、まずはお確かめください。30日間無料でお試しいただけます。
DataSpider Servistaの「つなぐ」を体験できる製品紹介・オンラインセミナーを開催しています。