「源氏物語」にも「データ分析」の話題がある
マーケティング部の渡辺です。
データやITなどに関する様々なことをゆるく書いているコラムです。
「源氏物語」の話題:2025年の執筆公開で恐縮ですが
今回は「源氏物語」に関する話を少し書きます。源氏物語(あるいは紫式部)は2024年の大河ドラマのテーマでした。今は2025年の秋なのでやや恐縮なのですが。
データみたいなこととは無縁に思える「源氏物語」や「紫式部」にすら、「データ分析に関連する話題がある」という話をします。世の中、本当に多くのことがデータに関係しています。
源氏物語の謎
念のためですが、最初に「源氏物語」とは何かについて少し書きます。
源氏物語は、平安時代に書かれた長編の物語で、日本の古典文学作品です。作者は「紫式部」とされます。源氏物語は日本で広く知られているだけではなく、20世紀(戦前の1920年代)になってイギリス人のアーサーウェイリーによって英訳されたものが非常な評判を呼び、それにより世界的にも広く知られる文学作品となります。
紫式部は、広い分野で「できる人」だったようです。百人一首にも紫式部の作品が残っているなど和歌の達人であり、当時女性が理解していることが珍しかった漢詩や漢書に通じ、歴史にも通じているなど、多くの分野で優れている人であるという話が当時の記録に残っています。
残念ながら源氏物語の当時の原本はすでに失われており、オリジナルのものがどういうものだったのかはわからなくなっています。今残っているもので最古のものは鎌倉時代の写本で、それらから「54帖」(54巻)の構成、100万文字を超える長編の物語だったと考えられています。
歴史学とは
さて、その源氏物語や紫式部ですが、1000年以上前のことなのではっきりとわからないことが多く、つまり歴史学が取り扱う範疇のものになります。
歴史の話をするみたいなことになると、一般的には「歴史ロマンを語る」みたいなことが多いと思います。例えば、歴史上の偉人から生き方を学ぼう、みたいな語りとか、私の想像した歴史の真実はこうだみたいな説(例:徳川家康のブレーンであった天海の正体は明智光秀説など)などになりがちかなと思います。
それはそれでやっていけないことでは全然ないのですが、そのような自分を語るようなことでは「学問としては」成り立たないので、「歴史学」としては「エビデンス」をベースにして「当時の事実」について追及する活動が行われています。
エビデンスとは、「今に残されている古文書」の内容や、ある地域に伝えられてきた伝承の内容、「遺跡発掘で出てきたもの」などです。織田信長はこう思ったに違いない、ではなくて、織田信長が家臣に宛てた手紙が残されていて、手紙にはどう決断すべきか迷っていて相談している記述がある、このことから手紙を出した時点では信長は決断を下しておらず、城から兵も動かしていないのではないか、というような取り組み方です。
ただし、古文書が本物かどうかは確認する必要がありますし、織田信長なら、織田信長が自身の理解の範疇で意図もあって書いているので、書かれていることをそのまま当時の客観的事実とみなせるわけではなく(むしろ古文書はそれぞれの立場陣営でのバイアスまみれだったりするものだと聞きますが)、諸々を酌量しての解釈も必要になります。
現在における「データ活用」
現在、世の中ではデータ活用の機運が高まっています。各社で色々な取り組みが行われていると思いますが、ここまでで話題にしたた「市井の歴史語り」と「歴史学」の違いも、「データ活用とは何をすることですか」を考えるヒントになるかもしれません。
データを適切に解釈することは難しく、作為的にデータを読み取ってしまうようなこともできてしまうので、データを基にしているから絶対正しいみたいなスタンスもまた問題ではありますが、しかしながらビジネスでも「エビデンスをベースにして事実を推定する議論」をすることができて、そのためにITやデータを活用することができる、と考えることはできると思います。
源氏物語
源氏物語について「こうである」とされていることも、現在残されている歴史資料から当時どうだったかが推定されたことです。ただし、1000年以上昔のことなので、はっきりしていないことも多々あります。
まず、源氏物語のオリジナルはすでに喪失しており、当時にはコピー機も印刷機も何もなく、書物は「写本」(人が読んで書き写す)で複製されていた時代なので、何度も書き写される前のオリジナルがどういう内容だったか、そもそもどういう構成のものだったかもよくわからなくなっていることがあります。
さらには源氏物語そのものには「作者:紫式部」とは書いていないらしく、諸状況から紫式部が作者だろうと考えられている状況です。たとえばこんな感じですかね、
- 源氏物語のオリジナルの原本は喪失しているが、現在まで残っている写本では54帖の物語となっている(が最初から54帖の構成だったのかは不明)
- 源氏物語そのものに「作者:紫式部」のような記述があるわけではない
- 紫式部という才女がいたことが当時の多数の記録に残っているので(百人一首には紫式部が詠んだ和歌があるなど)、紫式部という人は実在したと考えるべき。
- 紫式部が源氏物語を書いたといろいろな記録に残っているので、作者である可能性が高いと推定される。だが、本当に彼女が自分で全部書いたと確定できるエビデンスがあるわけではない。
我々が学校で「紫式部が作者です」(と書くとテストでマルがもらえる)と習っているときの明確さとはやや違う感じがあります。
はっきりしていないので、「源氏物語の真の作者は別にいる!」みたいなことを言い張ることもできなくはありません。しかし、その説を支持するエビデンスが従来説よりも十分にあるんですか?と言われると「ないですよね」という状況です。ただし、間違いなく紫式部が作者であると言い切れるんですか?というと、そうではありません。
このように「おそらくそうではないかと推定する」という「歯切れの悪い話」になりがちです。はっきりしない物言いは世の中では歓迎されないこともありますが、しかしこういう態度が「エビデンスをベースした慎重なスタンス」でもあるんだと思います。
ネガティブケイパビリティ
エビデンスをベースにした論理的な議論は、ビジネスでの取り組みでも望まれていることですが、そういう思慮が十分にある思考では「たぶん作者は紫式部だが、他の可能性が否定できないわけではない」というような「なんだかモヤモヤしたもの」になりがちだということです。
昨今では「わかりやすい断定調の結論」がもてはやされがちです。そのような風潮に対して「ネガティブケイパビリティ」(不確実なものや未解決なことをそのままにしておける能力)が大事ですよと言われたりするようになりました。
また、「はっきりしていないから完全に否定できない」から誇張して「源氏物語は明治維新以降に捏造された偽書である」とか言い張れば、センセーショナルで、もしかすると心躍る話であり、モヤモヤ感も一気に晴れ(ただしエビデンスは皆無)待望の真実が明らかになった感があることもあります、というのが昨今問題になっている「陰謀論」の正体かと思います。
でも現実には、わかったこと(エビデンス)が増えてもなお、それでもモヤモヤがなくならないものだし、結論あるいはデータから導かれるもの)は往々にしてモヤモヤしていることは受け入れなければいけないのだろうと思います。
「歴史を残す」「データを残す」大事さ
また、後世に歴史(エビデンス)をきちんと残すことが大事であることも考えさせられます。例えば、現存する日本最古の物語は「竹取物語」だとされますが、誰が作者なのかよくわかっていません。かぐや姫の物語は、日本中でとてもよく知られているわけですが、なんと悲しいことに誰がどういう経緯で書いたのか、はっきりとは解らなくなっています。日本にとって、大変大きな損失かもしれません。
比較すると、源氏物語や紫式部の当時については多くのことが知られています。当時のことが比較的よくわかっているのは、その当時、日記を書いていた平安貴族が多くいて、彼らの書いたものが古文書として残っているためです。
特に、日記馬鹿としか言いようのないくらいに宮中の細かいことを大量に書き残した「藤原実資」(ふじわらさねすけ:大河ドラマではロバート秋山が演じていた貴族)がおり、彼の日記である「小右記」により、他の時代よりも当時のことがとてもよくわかっています。我々はロバート秋山に感謝せねばなりません。
「記録が消えてしまって当時のことが解らない」は何も昔に限ったことではありません。例えば、日本が製造業でどんどん発展していた昭和の家電、実物や記録が残っていないために当時どうだったのかが既にわからないことがあるようです。またインターネット時代以降についても、ゼロ年代に大流行りした個人サイトが、無料ホームページサービスがサービス終了してしまって今では失われていることがあります。
企業のデータ活用においても、「データはデータレイクなどにきちんと残しておきなさい」とか、整理して記憶を残しておかないと少し前の大事なことすら解らなくなることがあるとか言われることがあります。例えば、久しぶりに製品を大幅リニューアルしようとしたところ、過去バージョンの意味深で不思議な製品仕様がどうやって決まったのかわからず、機能を廃止変更してよいか判断ができなくなってしまうようなことは、ある話ではないかと思います。
「作者は誰?」
そういうわけで本質的にまだわからないことも多くあるわけですが、源氏物語をめぐって謎として議論されることがあるのが、源氏物語の終わりの部分「宇治十帖の作者は紫式部なのか?」です。
謎:「宇治十帖」の作者は誰なのか?
源氏物語の終わりの部分、物語の舞台が「京都の宇治」になったところ(宇治十帖)から文体が異なっている印象があり、他の人が書いたのではないか?という指摘が昔よりずっとあります。読んだところ「どうもここから印象が違うんだけれど?」と思う人が多かったわけです。
でも「そのように思います」はエビデンスベースの意見ではありません。古文書にも「作者違うんじゃね?」とか「紫式部の実の娘の大弐三位(こちらも才女であったとして当時の記録に残っている)が作者ではないか」と書いてあるものもあり、「昔の人も疑わしく思っていた」ことがエビデンスとして残っているとは言えますが、作者が実際誰なのかを判断する材料にはなりません。
長年どうにもならない疑問だったこの話題ですが、20世紀になって「新しい方法」での追及が可能になりました。源氏物語をテキストデータとして、テキストの特徴を数量的に分析して「同一の作者であると考えられるか」という研究が行われるようになりました。
源氏物語、データやITとは無縁にすら思えるかもしれない分野ですが、ほとんど1000年にわたる疑問を解消する新しい手段として、データ分析が活用されています。
ただし、データ分析でも明確な結論は出ていないようで、宇治十帖とそれ以前の部分について比較すると、統計的に優位な差異は存在するという研究結果※1はあるようですが、一方で、別の人が書いたと言えるほどには差異がないという研究結果※2もあるようです。
考えてみても、同じ人が異なる文体で文章を書きわけることはそもそもあることですし、時間が経つと文体は変化したりします。また、他の人が書いたテキストなのに自分と発想やスタイルが似ているなと思うこともありますし、例えば「村上春樹風に書く」のが得意な人がいるなど、紫式部を超リスペクトして(あるいは読者に続編として違和感なく読んでもらいたいため腐心した)ので、他の人が書いているのに似ていることもあるかもしれません。
ただどうやら「違いがある」ことは客観的に明らかにできたようです。ただし、別の人が書いた(例えば紫式部の娘が書いた)が似ているのか、本人の文体が変化した(例えば宇治十帖は紫式部が晩年になって別途書いた)のかは、まだ議論が必要なようです。
シェイクスピアの正体は誰?
このような、データを用いて「謎の作者」の正体を突き止めようとする取り組みは他にもあります。
英国文学あるいは世界文学に絶大な足跡を残したウィリアム・シェイクスピア、彼の作品があまりにも有名であるのに対して、シェイクスピア本人についての資料が乏しすぎて日記のようなものすら残っていないことや、作品から受ける深い教養と彼の経歴(大学に行っていない)の辻褄があわないとして、作品を書いたのは別の有名人で、書くときに使っていた別名義ではないかという疑惑がずっとありました。
主流の学説というよりは、学術的にはちょっと眉唾気味な話だが世間受けする面白い話題のような印象もあり、これまで世界中で多くの人が「あいつが正体だ!」みたいな独自の説を主張している状態です(きりがないくらいに多くの説がある)。そして、こちらでもデータ分析による研究も行われています。
その結果、「一部のシェイクスピア作品が別の著者との共作ではないか?」という論文が最近になって出てきています。
その昔から、シェイクスピアの正体ではないかと疑われていることがあった、同じ時代の劇作家「クリストファー・マーロウ」との「共著」(クリストファー・マーロウ自身がシェイクスピアの正体ではなく)であると思われる作品が明らかになったという話題です。論文はなんと2016年になって出てきたものです。
ただし、この論文の主張が広く学会で同意されてすべて決着したかというとそうでもないようで、まだ議論は続きそうです。
ビットコインの作者「ナカモトサトシ」の正体
ビットコインの作者は「ナカモトサトシ」と名乗る正体不明の人物です。そして、これまで多くの人が「あいつがナカモトサトシの正体だ」と言われてきました。
一般メディアで本人判明と大きく報じられた人物もいましたが(ドリアン・サトシ・ナカモト氏とか)、さすがにその人ではないではないか?という人が多かった印象で、結局誤報でその後報じられなくなり、正体が誰なのかは不明なままになっています。
日本人が正体であるという噂を見かけることもありました(京都大学数理解析研究所の望月新一教授や、NTT基礎研究所の暗号理論の権威の岡本龍明氏など)が、こちらもそもそも信じがたい説でした。
私にも有力なのではないかと思える説を二つ挙げると、すでに故人であるハル・フィニー氏が正体である説や、ビットコインと似た仕組みを実現しようとしていたビットゴールドの作者ニック・サボー氏が正体ではないかと言われていることがあります。
ハル・フィニー氏はドリアン・サトシ・ナカモト氏の近所に住んでいたことがあり、ビットコイン類似でビットコインよりも前にあったプロジェクトのビットゴールドの関係者でした。ただし、すでに故人です。
ニック・サボー氏はビットゴールドのそもそも論文を書いており、さらにはナカモトサトシがビットコインの基本的アイディアを記した有名な重要文書(以下リンクは原文ではなくて「それを日本語訳したもの」ですが)の「テキストの特徴」が、ニック・サボー氏の特徴と一致するという話があります。
データの時代
昨今はデータの時代だとか盛んに言われますが、データ活用とは「いかにもデータ分析っぽいことに取り組む」ことばかりではないこと、世の中のとても広い分野でデータ活用がなされており、その分野での実用的なニーズに染み込むような使われ方で利用されていることを紹介させていただいたつもりです。
そういう例として、源氏物語についての長年の謎(あるいは論争)とか、シェイクスピアの正体についての議論でも、データ分析が重要な役割を果たしている話を紹介しました。
一般的に「源氏物語」というとテクノロジーっぽい印象は皆無だと思います。皆さんが日ごろ関わっている各分野とか自身の担当タスクを比べてみてどうでしょうか、源氏物語研究よりはテクノロジー(あるいは実務)っぽいことがほとんどだと思います。源氏物語ですらデータが活用されているのなら、他の分野では当然データ活用の余地は大いにあるはずです。
「あなたもデータ活用に取り組む」ために必要なもの
このように、これからはどんな分野でもデータ活用のことを考えなければいけない時代になりましたが、かといって源氏物語の研究者が全員、PythonをマスターしてAWSをバリバリに使いこなして、みたいなことをするのはさすがに無理です。みんながデータを活用する時代ですが、みんながフルセットのデータ活用スキルを身につけろというのは無理があります。
あるいは言い換えると、フルセットのデータ活用スキルみたいなもの「以外」に、「必要なこと」がむしろ実際にはあり、役に立つ成果を出すためにはそちらもおろそかになってはいけないということです。では、どうしたらよいのでしょうか。
フルセットのデータ分析スキルがなくても、「自分自身で」活用できるセルフサービスBIツールを活用し、分析を実施するための必要なデータの用意(実は分析作業そのものよりもこちらの方が大変なことが多い)を「自分自身で」行えるようにすれば、データの活用ニーズ側をよくわかっている人が自分でデータ活用に取り組むことができます。
そこで活用してほしいのが、我々のプロダクトです。ノーコードで多種多様なところから分析に必要なデータを用意でき、前加工も自由自在にできる我々のプロダクト(DataSpiderやHULFT Square)を活用いただくことで、ご自身での、あるいは業務の現場主導でのデータ活用を実現することができます。
「源氏物語をデータ分析する」のが「意外に思えた」なら、それはビジネスで言うならあなたの競合相手にとって予想外の手ごわい一手だということです。データ活用には色々な取り組み方があるはずです。「まさかそんなところでデータ分析を使っているとは」となれば当然に自分たちが有利になります。我々のプロダクトをぜひご検討ください。
執筆者プロフィール

渡辺 亮
- ・マーケティング部 デジタルマーケティング課 所属
- ・2017年 株式会社アプレッソより転籍
- ・大学で情報工学(人工知能の研究室)を専攻したあと、スタートアップの開発部で苦労していました
- ・中小企業診断士(2024年時点)
- ・画像:弊社で昔使われていた「フクスケ」さんを私が乗っ取りました
- (所属は掲載時のものです)
ITとビジネスの今どきコラム 一覧
- Vol.01 なんで「紙に書いて投票する」のか ~ITと「安全安心」について考える
- Vol.02 学習データの増加が限界に到達した「生成AI/LLM」は今後どうなるのか?
- Vol.03 不景気の時こそ「すごく売れる」商品があるって知ってました?(世の中何でもチャンス)
- Vol.04 AWSは、「どんなものもいつでも壊れる前提」で作られている
- Vol.05 社会インフラの事故が相次いでいるのはどうしてか考える~これから再評価されるかもしれない「安全安心」
- Vol.06 「核融合」と「錬金術」が合体した未来がやってくる?~「つなぐ」ことの可能性を考える
- Vol.07 「月食」よりも「日食」の方が実は多い~あるいは「データを読む」ことについて考える
- Vol.08 「源氏物語」にも「データ分析の話題」がある