データ活用やDXがどんどん解る用語集
ChatGPT(Chat Generative Pre-trained Transformer)
「ChatGPT(Chat Generative Pre-trained Transformer)」
データ活用やDX成功に必要な考え方を、各種キーワードの解説で理解できる用語解説集です。
今回は、今後のビジネスでのデータやAIの活用での活用が期待されている「ChatGPT」について考えてみましょう。
ChatGPT(Chat Generative Pre-trained Transformer)とは
ChatGPT(Chat Generative Pre-trained Transformer)とは、OpenAI社が開発提供している対話型AIサービスです。大規模言語モデル(LLM)であるOpenAI社のGPTをベースに開発されており、生成AIの一種に分類されます。
ChatGPT は2022年11月に公開されると、対話型のインタフェースによりまるで人間とチャットするかのように利用できる画期的な利用感、自然言語での指示により多様なタスクをこなせる従来にはない能力を備えていることから世界的に大ブームとなり、今後ビジネスのみならず社会で広く活用されることが期待されています。
目次
大規模言語モデル「GPT」をチャットにしたもの
ChatGPTはOpenAI社が自社で開発していた大規模言語モデル「GPT」(Generative Pre-trained Transformer)、具体的には「GPT-3.5」をベースに開発された「対話型のインタフェースで利用できるAI」です。「生成AI」としても分類され、世間においては、昨今流行の「生成AI」の代表例であるとみなされていることも多いかと思います。
ChatGPTの基礎となっている技術は、大規模言語モデルのGPTですが、GPT(GPT-1)はOpenAI社により2018年に登場しています。2020年に登場した「GPT-3」では、人間が書いたものと区別できないくらい自然な文章を生成できる恐るべき技術が登場したとして、技術に詳しい人たちにおいては、世界的に大きな議論になるほどの存在になっていました。
このようにGPT自身は以前から存在していて話題にもなっていたのですが、そのGPTに調整を行って「チャット」として利用できるようにして外部にサービスとして提供開始したものが「ChatGPT」です。ChatGPTはそのようにして、2022年11月にOpenAI社によりプロトタイプのサービスとして提供開始されました。
「大規模言語モデル(LLM)」については、こちらの記事も併せてぜひご覧ください。
⇒ 大規模言語モデル(LLM:Large Language Model)|用語集
ChatGPT登場後の「空前のブーム」
その当時、世間の多くの人はGPTについてもOpenAI社についても聞いたこともない状態でした。プロモーション活動も行われませんでしたし、無料で利用できたとはいえ利用登録の手順すら解りやすくはありませんでした。通常ならよくできたサービスであってもなかなか利用者の獲得すらできない状況です。
にもかかわらず、サービス登場からわずか二か月でアクティブユーザ数が一億人を超えるなど空前のブームとなりました。解りやすく使いやすいサービスとして提供され、積極的なプロモーションが行われている一般向けのクラウドサービスと比べての異例の早さでした。アクティブユーザ数の一億人到達はInstagramでも2年半、TikTokにおいても九か月かかっています。
技術的な意義や、活用して出来ることのみならず、ChatGPTには、社会に与えた衝撃の大きさと、社会からかつてないほど注目されている点において、かつてない存在であると言えます。
「対話型のインタフェース」である特徴
ChatGPTがこれほどまでに話題になったのは、対話型のインタフェースだったからではないかとも考えられます。例えばiPhoneのSiriは(ChatGPTと比べると)会話能力はあまり高くなくキーワードへの反応に加えてもう少し対応できる程度でしたが、しかし会話できること自体が印象的で利用者に強い印象を与えました。AmazonのAlexaにも同じようなところがあります。
さらにはコンピュータに十分な処理能力がなかった時代にすら、人間と会話をしているかのような「チャットボット」が開発されて大きな話題になったことがあります。
有名なものに1966年に開発されたELIZA(イライザ)があります。人間の発話内容は全く理解しておらず、適当に相槌を打つとか、相手の入力したフレーズを使って「単純な文字列処理だけ」で理解せずに言い返す程度が実装されているだけでした。いわばトリックで会話をしているように錯覚させる程度のものでした。
しかし、ELIZAはしっかり自分の話を聞いてくれていて、精神科医として相談に乗ってもらっていると信じてしまう人が続出、ELIZAに真面目に悩みを打ち明けて相談に乗ってもらう人が出てしまうという驚くことが起こります。
考えてみると人同士でも、話の内容はほとんど聞いていないとか全く理解できていないけれど、適当に相槌をうっているとか、相手の言ったことを言い返すなどで、なんだか会話になってしまっていることがあります。
また、iPhoneの「Siri」が「Siriさん」と呼ばれているようなことは時々あるとおもいます。一方で「iPhoneさん」と呼ぶことはほとんどありません。人間は会話をする存在に対して特別な反応をして感情移入をしてしまうのです。
おそらくそれくらい、人や人の脳にとって「会話をする存在」は特別なものであり、ChatGPTが「会話をするAI」として登場したことは、これまでのITが満たせていなかった「人のニーズ」にマッチし、それにより爆発的な話題になったのではないかと思います。
自然言語での「プログラミング」を可能にした
従来、コンピュータに何かをやってもらいたければ基本的にプログラミングが必要でした。アプリケーションを使えば、事前に提供された機能の範囲ならば多くのことは出来ましたが、それ以外の新たなことをしたいと思ったとき、プログラミングを経なければ、その要望はコンピュータで実現することはできませんでした。
ChatGPTでは、自然言語でコンピュータに行って欲しいことを指示するだけで様々なことができてしまうことがあります。データ形式を変換してほしい、データをグラフとしてビジュアルにまとめてほしい、グラフの見た目を調整してほしい、人間に依頼するのと同じように、プログラミングをせずに自然言語でコンピュータを操ることができるような利用感だと言えます。
さらには、どういうプログラムを作ってほしいかを指示すると、それを実現するプログラムのソースコードを出力する、つまり指示通りにプログラミングを自動で行えるような挙動もします。残念ながら、(現状の)ChatGPTの出力には、間違いや考慮漏れ、指示していないことなどが混ざってしまいがちで、見た目から受ける印象ほどには実際にはいろいろなことは出来ません。
そのため、ただちに全てのプログラミングやプログラマの代わりになるものではありませんが、それを踏まえても、自然言語が使えるだけでコンピュータを自在に操れるような利用感や可能性は、日本語が使えればプログラミング相当のことができる、あるいは自然言語の日本語をプログラミング言語として利用できる環境が登場したとみなすことができます。かつてない利用体験であると言えます。
自然言語で利用できる「生成AI」
ChatGPTはメディアでは「生成AI」として紹介されることがよくあります。確かにベースとなっている技術は生成AIとも呼べるものですが、生成AIはChatGPTのようなものだけを指す言葉ではありません(もっと具体的には「チャット機能」のことを「生成AI」と呼ぶわけではない)。
「生成AI」は、チャット以外の多くの利用形態も想定する言葉です。この辺、良くわからなくなっている人もいると思います。
「生成AI」の画期的な利用環境としてのChatGPT
世間では生成AIと呼ばれていることが多いChatGPTですが、「生成AI」というよりも、大規模言語モデルを用いて開発された「自然言語での会話能力を持つAI」と説明する方が適切ではないかと思います。
ChatGPTには生成AIとしての側面はもちろんありますが、「自然言語での会話」をユーザインタフェースとして「生成AI」を画期的な利用感で利用できることが、ChatGPTの特徴を適切に説明しているのではないかと思います。
あるいは、プログラミングや特別な手段などを用いることなく、自然言語で利用者の要望を伝えることで利用できる画期的環境としての側面と、ユーザが望む出力を生み出すことができる生成AIとしての側面を併せもっていることが、ChatGPTの特徴であると考えることができます。
「ハルシネーション」の問題
残念ながらChatGPTの回答には、不十分なものや間違い、さらには明らかな嘘が混ざってしまう傾向があります。従来の技術と比べると、驚くほど多様なタスクに対処する能力はあるものの、その一方でその遂行能力については不完全なところも目立ちます。
「利用感」は画期的で、印象だけで判断するとすごく賢い印象すら受けることもあるのですが、もっともらしく思える回答をしているけれども回答の内容の質は必ずしも良くないことから、「堂々と嘘をつく」とか「流暢なたわごと」と評されていることがあります。
例えば(少なくとも現時点では)プログラミングをお願いするとソースコードを生成するので一見かなりプログラミングができるように見えます。しかし、そのソースコードは実際には動かないことや望まない挙動をすることが良くあります、しかもChatGPTはそのような問題のある回答を、自信満々でさもとてもよく理解しているような体で回答したりします。
このような特性は利用上注意を要するものです。さらには、間違っているのに説得力があり堂々と嘘を言う特徴は、悪用されて世の中に偽情報を広める手段などに使われると大変危険でもあります。
特によく話題になる問題点として、知識が足りないとか不正確であるのレベルではなく、「全く存在しないこと」をさも存在するかのように回答してしまう「ハルシネーション」と呼ばれる現象があります。例えば、全く存在しない映画について、さもそんな映画があるかのように作品のディテールや作品にまつわる逸話までを自身満々に回答してしまうような現象です。
ハルシネーションはどうして発生する現象なのか(執筆時点では)わかっていません。学習データ不足なだけで増えれば解消すると世間では思われていることも多いですが、原因不明の現象であり、ニューラルネットワークを用いた技術そのものが抱える根本的な問題である可能性があり、学習データを増やしても解決しないことがあることも解っています。
事実について尋ねる手段として活用したい場合や、判断や論理に間違いがあってはならない用途での活用では、ハルシネーションは致命的な挙動です。ChatGPTの活用において、考慮しておくべき重大なリスクであると言えます。
ChatGPTの業務利用で気を付けること
ChatGPTなど対話型のAIを業務で利用する場合には、いくつか気を付けるべきことがあります。
入力した内容が学習に使われることがある
利用者が入力した内容が、AIの学習に使われることがあります。その結果、機密情報やプライバシーのデータが学習されて組み込まれてしまい、外部に流出するような結果になる可能性があります。そのようなデータを不用意に入力しないようにするか、データを学習に利用しない設定で利用する必要があります。
正確ではない出力をすることがある
知識のない人には一見もっともらしく見えても、正確ではないことや不正確・不十分な回答をすることがあります。自動生成させたプログラムコードが脆弱性のあるコードであるような場合もあります。自分で十分に内容を確認して利用するか、あるいはアイディア出しの支援などリスクの低い用途で利用する必要があります。
著作権侵害や、モラルの問題など社会的な注意
AIが学習に使った元のデータをほぼそのまま出力してしまうなど、著作権など知的財産権やプライバシー権などを侵害するデータを出力してしまう可能性があります。また、生成AIを用いた活動やコンテンツ生成の是非に対して社会的議論が残っている分野での利用など、慎重な利用や、生成されたコンテンツを利用していることを隠さずに明示した上での利用が望ましいいことがあります。
「プロンプトエンジニアリング」でChatGPTをうまく活用する
ChatGPTは自然言語でのプログラミングにも例えられますが、言い換えれば日本語しか使えない状況でプログラミングする状況とみなすこともできます。
特に現状、日本語で要望を述べるだけで望んだ結果が十分に得られる状況ではなく、要望がうまく伝わらなかったり、思っていたものと違うものや間違ったものを出力したりしがちです。そうならないように「工夫して」使わないとうまく使いこなせない状況があります。
工夫すると言っても、テキストデータの入力しか使えない環境です。その範囲でうまく使いこなす必要があります。そこで、単に要望をテキストとしてタイプするのではなく、ChatGPT向けに配慮し工夫した自然言語の記述(プロンプト)が考案されるようになります。プロンプトエンジニアリングと呼ばれる取り組みです。
プロンプトエンジニアリングの是非
プロンプトエンジニアリングは本質的な取り組みとはいえず過渡的なバッドノウハウであるとみなす考え方があります、一方で生成AIの活用において本質的な取り組みであり、これから発展し必須になるテクニックであると考える人たちもいます。
プロンプトエンジニアリングのテクニックの例
人間のプログラマに対して、仕様書を書いてシステム開発を行ってもらうときのように、要望や要望の背景や目的などを、論理的かつ明瞭に記述することがまず推奨されています。また、それ以外にも「プロンプトに特定のフレーズを含ませると性能が改善する」など、ChatGPT(ないしは大規模言語モデル)固有の独特なテクニックが発見されつつあります。
プロンプト作成のテクニックの例:
- Few-Shot プロンプティング / Few-shot Learning
- CoT:Chain-of-Thought / Zero-shot CoT
- 英語で考えて日本語で回答してください
ユースケース例
ChatGPTを活用ユースケースとしては以下のようなものが考えられます。
- 電子メールやビジネス文書の作成支援
- 翻訳
- 文章の要約
- 文章の校正、文章を読みやすくする
- 文体や対象読者を変更する
- 文章の体裁の変更
- -箇条書きを文章に、文章を箇条書きに、文章を会話のやり取りに変換するなど
- データ変換(漢数字をアラビア数字に変換するなど)
- 項目の列挙
- -アンケート項目、データ項目、作業タスクの一覧洗い出しなど
- アイディアを出してもらう
- -キャッチフレーズやコンセプトなどを生成する
- -キーワードを与えて作文させる
- -たとえ話を考えてもらう
- -ブレインストーミングを手伝ってもらう
- -ディベートをさせる
外部のシステムやデータと連携して活用できる「iPaaS」
ここまでは、人間が自分でテキストをタイプしてChatGPTを利用する使い方を想定した説明をしてきました。そもそもチャットシステムとして開発されていますから、人が自分で利用する活用方法は製品の意図に沿ったものではあります。
しかし、ChatGPTの対話能力を自分たちのシステムに組み込みたいような場合もあるでしょうし、自分たちがAI等を用いて活用したいデータや機能は、ChatGPTの外部にあるものが多いはずです。また、ChatGPTをプログラムなどにより外部から自動で呼び出して処理結果を活用するような用途でも活用検討されつつあります。
そうなると進んだ活用のために必要になってくるのは、外部のデータやシステムと組み合わせて利用する手段をどうやって確保するかであると言えます。プログラミングで実現することはできますが、せっかくプログラミングなしで利用できるChatGPTですから、同じく別の方法でなんとかしたいところです。
そこでChatGPTなど対話型のAIのさらなる活用を実現する手段として活用できるのが、自分たちでソースコードを書いて開発することなく、大規模言語モデルと様々なクラウドやシステム、データを自在に連携できる手段です。例えば「EAI」や「ETL」、「iPaaS」と呼ばれる、「DataSpider」や「HULFT Square」などの「つなぐ」技術の活用です。
GUIだけで利用できる
通常のプログラミングのようにコードを書く必要がありません。GUI上でアイコンを配置し設定をすることで、多種多様なシステムやデータとの連携処理を実現できます。
「GUIで開発できる」ことは長所でもある
GUIだけでのノーコード開発は、本格的なプログラミングに対して簡易で妥協的な印象を受けるかもしれません。しかしながら、GUIだけで開発できれば「業務の現場の担当者が自分たち自身で主体的にAIの活用に取り組む」ことが可能になります。
ビジネスのことを一番良くわかっているのは現場の担当者です。彼ら自身によって、データやAIの活用の作りこみなど、必要なことをどんどん作りこめるのは、何かあるたびにエンジニアに説明してお願いしないと開発できない状況より、優れているところがあります。
本格的処理を実装できる
「GUIだけで開発できる」ことを謳っている製品は沢山ありますが、そういう製品に簡易で悪い印象を持っている人もおられるかもしれません。
確かに、「簡単に作れるが簡易なことしかできない」「本格的処理を実行しようとしたら処理できずに落ちてしまった」「業務を支えられるだけの高い信頼性や安定稼働能力がなくて大変なことになってしまった」ようなことは起こりがちです。
「DataSpider」や「HULFT Square」は、簡単に使うこともできますが本格的プログラミングと同等のレベルの処理の作りこみもできます。内部的にJavaに変換されて実行されるなど本格的プログラミングと同様の高い処理能力があり、長年にわたって企業ITを支えてきた実績もあります。「GUIだけ」の良さと、プロフェッショナルユースとしての実績と本格的能力の両方を兼ね備えています。
データ活用を成功させる「データ基盤」として必要なこと
多種多様なデータソースへの接続能力はもちろん必要になりますし、実業務をしっかり支えるためには大量のデータを処理できる高い処理能力も必要になります。その一方で、現場主導での柔軟かつ迅速な試行錯誤がどうしても重要になることもあります。
一般的には、高い性能や高度な処理の実現を求めると本格的なプログラミングや利用が難しいツールとなりがちで、現場での使いやすさを求めると利用しやすいが処理能力が低く簡易な処理しかできないツールになりがちです。
さらに加えて多種多様なデータソース、特にメインフレームなど昔からあるITシステムや現場のExcelなどモダンではないデータソースへの高度なアクセス能力、クラウドなど最新のITへのアクセス能力も併せて持っている必要があることも望まれます。
この条件のいずれかを満たすだけなら多くの手段があるでしょうが、データ活用をうまく進めるためにはすべての条件を満たす必要があります。しかし、現場でも十分に使えるが、プロフェッショナルツールとして高い性能や信頼性を兼ね備えている、そんなデータ連携の実現手段となると多くはありません。
iPaaSなので自社運用不要
DataSpiderなら自社管理下のシステムでしっかりと運用できます。クラウドサービス(iPaaS)のHULFT Squareなら、このような「つなぐ」技術そのもの自体もクラウドサービスとして自社運用不要で利用でき、自社での導入やシステム運用の手間がなく利用できます。
関係するキーワード(さらに理解するために)
- EAI
- -システム間をデータ連携して「つなぐ」考え方で、様々なデータやシステムを自在につなぐ手段です。IT利活用をうまく進める考え方として、クラウド時代になるずっと前から、活躍してきた考え方です。
- ETL
- -昨今盛んに取り組まれているデータ活用の取り組みでは、データの分析作業そのものではなく、オンプレミスからクラウドまで、あちこちに散在するデータを集めてくる作業や前処理が実作業の大半を占めます。そのような処理を効率的に実現する手段です。
- iPaaS
- -様々なクラウドを外部のシステムやデータと、GUI上での操作だけで「つなぐ」クラウドサービスのことをiPaaSと呼びます。
- 大規模言語モデル
- -大規模言語モデル(LLM:Large Language Model)とは、大量のテキストデータで学習した自然言語の言語モデルのことです。通常はディープラーニング技術を用いて大量のコーパスを学習させたニューラルネットワークの学習済みモデルのことを指します。ChatGPTの基盤となっている技術としても知られます。
「つなぐ」取り組みに興味を持たれましたら
興味を持たれましたら、ITシステムやビジネスの問題を「つなぐ」考え方で解消する製品を実際に試してみてください。
「つなぐ」ツールの決定版、データ連携ソフトウェア「DataSpider」「HULFT Square」
当社が自社で開発販売しているデータ連携ツール「DataSpider」「HULFT Square」は、長年の実績がある、「つなぐ」ツールです。
通常のプログラミングのようにコードを書くこと無くGUIだけ(ノーコード)で開発できるので、ビジネスについて良く理解し、自社のサイロ化の具体的な課題についても把握できる業務の現場が自ら活用に取り組めることも特徴です。
簡易な連携できるツールは世の中に多くありますが、GUIだけでプログラマではなくても十分に使える使いやすさをもちつつ、「高い開発生産性」「業務の基盤(プロフェッショナルユース)を担えるだけの本格的な性能」を備えています。IT利活用の成功を妨げている「バラバラになったシステムやデータをつなぐ」問題をスムーズに解決することができます。
無料体験版や、無償で実際使ってみることができるオンラインセミナーも開催しておりますので、ぜひ一度お試しいただけますと幸いです。
用語集 コラム一覧
英数字・記号
- 2025年の崖
- 5G
- AES
- AI
- API【詳細版】
- API基盤・APIマネジメント【詳細版】
- BCP
- BI
- BPR
- CCPA(カリフォルニア州消費者プライバシー法)【詳細版】
- Chain-of-Thoughtプロンプティング【詳細版】
- ChatGPT(Chat Generative Pre-trained Transformer)【詳細版】
- CRM
- CX
- D2C
- DBaaS
- DevOps
- DWH【詳細版】
- DX認定
- DX銘柄
- DXレポート
- EAI【詳細版】
- EDI
- EDINET【詳細版】
- ERP
- ETL【詳細版】
- Excel連携【詳細版】
- Few-shotプロンプティング / Few-shot Learning【詳細版】
- FIPS140【詳細版】
- FTP
- GDPR(EU一般データ保護規則)【詳細版】
- Generated Knowledgeプロンプティング(知識生成プロンプティング)【詳細版】
- GIGAスクール構想
- GUI
- IaaS【詳細版】
- IoT
- iPaaS【詳細版】
- MaaS
- MDM
- MFT(Managed File Transfer)【詳細版】
- NFT
- NoSQL【詳細版】
- OCR
- PaaS【詳細版】
- PCI DSS【詳細版】
- PoC
- REST API(Representational State Transfer API)【詳細版】
- RFID
- RPA
- SaaS【詳細版】
- SaaS連携【詳細版】
- SDGs
- Self-translateプロンプティング /「英語で考えてから日本語で答えてください」【詳細版】
- SFA
- SOC(System and Organization Controls)【詳細版】
- Society 5.0
- STEM教育
- The Flipped Interaction Pattern(解らないことがあったら聞いてください)【詳細版】
- UI
- UX
- VUCA
- Web3
- XaaS(SaaS、PaaS、IaaSなど)【詳細版】
- XML
あ行
か行
- カーボンニュートラル
- 仮想化
- ガバメントクラウド【詳細版】
- 可用性
- 完全性
- 機械学習【詳細版】
- 基幹システム
- 機密性
- キャッシュレス決済
- 業務自動化
- クラウド
- クラウド移行
- クラウドネイティブ【詳細版】
- クラウドファースト
- クラウド連携【詳細版】
- 検索拡張生成(RAG:Retrieval Augmented Generation)【詳細版】
- コンテキスト内学習(ICL: In-Context Learning)【詳細版】
- コンテナ【詳細版】
- コンテナオーケストレーション【詳細版】
さ行
- サーバレス(FaaS)【詳細版】
- サイロ化【詳細版】
- サブスクリプション
- サプライチェーンマネジメント
- シンギュラリティ
- シングルサインオン(SSO:Single Sign On)【詳細版】
- スケーラブル(スケールアップ/スケールダウン)【詳細版】
- スケールアウト
- スケールイン
- スマートシティ
- スマートファクトリー
- スモールスタート(small start)【詳細版】
- 生成AI(Generative AI)【詳細版】
- セルフサービスBI(ITのセルフサービス化)【詳細版】
- 疎結合【詳細版】
た行
- 大規模言語モデル(LLM:Large Language Model)【詳細版】
- ディープラーニング
- データ移行
- データカタログ
- データ活用
- データガバナンス
- データ管理
- データサイエンティスト
- データドリブン
- データ分析
- データベース
- データマート
- データマイニング
- データモデリング
- データリネージ
- データレイク【詳細版】
- デジタイゼーション
- デジタライゼーション
- デジタルツイン
- デジタルディスラプション
- デジタルトランスフォーメーション
- デッドロック/ deadlock【詳細版】
- テレワーク
- 転移学習(transfer learning)【詳細版】
- 電子決済
- 電子署名【詳細版】
な行
は行
- ハイブリッドクラウド
- バッチ処理
- 非構造化データ
- ビッグデータ
- ファイル連携【詳細版】
- ファインチューニング【詳細版】
- プライベートクラウド
- ブロックチェーン
- プロンプトテンプレート【詳細版】
- ベクトル化 / エンベディング(Embedding)【詳細版】
- ベクトルデータベース(Vector database)【詳細版】
ま行
や行
ら行
- 量子コンピュータ
- ルート最適化ソリューション
- レガシーシステム / レガシー連携【詳細版】
- ローコード開発(Low-code development)【詳細版】
- ロールプレイプロンプティング / Role-Play Prompting【詳細版】
わ行
おすすめコンテンツ
まずは無料で「つなぐ」をご体験ください
DataSpider Servistaのデータ連携を、まずはお確かめください。30日間無料でお試しいただけます。
DataSpider Servistaの「つなぐ」を体験できる製品紹介・オンラインセミナーを開催しています。