「最強」の統計家・西内氏が語る
データ分析を生かすために「煩悩」
「とんち」が必要なワケ

visual.png mob_visual.png

2013年に発売された「統計学が最強の学問である」の著者である統計家・西内啓氏。シリーズ累計は50万部を超え、現在は企業のデータ活用支援や各種分析ツールの開発などビジネスの第一線で活躍しながら、分かりやすい言葉で統計学の魅力を語り続けている。そんな統計分野のスペシャリストである西内氏に、これまで歩んできたキャリアをはじめ、子育てなど日常世界にも生かせるデータ分析の魅力、そして企業のDX推進に欠かせない最適な人材像などについて詳しく伺った。

統計家・西内啓ができるまで

統計学の世界で様々な活動をされていますが、統計家になるまでの経緯について教えてください。

高校時代などは特別に将来の夢があったわけではなく、単に数学や物理が得意な理系タイプで、宇宙の謎を解き明かしたいというよりは「人間とは何か?」に興味を持っていました。そこで、生物系の学部に進んだのですが、思っていたほど人間を学ぶことができませんでした。そこで目先を変えて心理学や社会学などに傾倒していくなかで、統計の魅力に気づいていったというのが実際のところです。大学1年のころから統計学の授業を受けていましたが、面白さを感じたのはその応用例を知ったことです。自分がいわゆる「文系の学問」と思っていた分野も実はきちんとデータに基づいて語っているということが分かり、得られた結果をどう生かすのかの面白さに気づきました。

ご自身は医学部に進まれていますが、統計学とどうつながってくるのでしょうか。

最近ようやくデータサイエンス学部といった統計学を専門に勉強できる学部が登場していますが、当時はそういった学部がありませんでした。確かに経済学部や工学部でも統計学を学ぶことは可能ですが、私の興味は統計学を通して人間を理解することです。そこで、人間を対象に研究する分野である医学部の中で生物統計学という分野を学ぶことにしました。

その後はどのようなキャリアを歩まれたのでしょうか。

医学の領域のなかでも、パブリックヘルス(公衆衛生学)という分野において統計学を学びました。お医者さんが1人ひとりの患者を治療していくのではなく、社会全体で病気の原因やリスクを見つけ、対策していくというものです。そのなかでも興味を持ったのがヘルスコミュニケーション分野です。例えば運動不足が健康に大きなリスクがあることはすでに周知の事実ですが、運動習慣はどうしたら身につけてもらえるのかといったことを研究していました。幸い若くして大学の助教となりましたが、より実践的に自分の知識を社会に役立てたいと思い、研究者というキャリアを辞し、企業におけるデータ分析のお手伝いをする今の仕事に至っています。

統計学自体は歴史が古いというイメージでしたが、専門学部ができたのは最近なのですね。

統計学は従来、工学部や経済学部、農学部といった学部の中でそれぞれ統計教育が行われていましたし、数学的には同じ手法でも微妙に考え方や使い方が異なっていたり、その分野のニーズに合わせた統計手法が開発されていたりすることもしばしばあります。しかし、私が学んだパブリックヘルスという分野は非常に面白く、まるで“総合格闘技”のように統計学を使えるのがとてもよい勉強になりました。極端に言えば“人を健康にするなら何をしてもいい”というのがパブリックヘルスであり、経済学をバックグラウンドに持つ方もいれば、政策科学や政治学が専門の方もいます。あるいは哲学や倫理、医療機器に関する工学的なアプローチ、さらにバイオサイエンスなど様々な分野の専門家たちがパブリックヘルス領域で活躍しています。まさに総合格闘技さながらの分野に身を置いて、比較的オールラウンダーに統計学の使い方を学ぶことができたのは私にとっては大きな経験です。

総合格闘技におけるルールとなる、共通言語的なものが統計的なアプローチというわけでしょうか。

バックグラウンドが異なるものの、エビデンスベースドという考え方が共通言語として根付きつつあります。対象者をランダムに分けて因果関係を見つけていくランダム化比較実験を実施したり、ランダム化が難しい領域でも統計的因果推論をやったりしながら、最終的にはエビデンス、つまりデータを含む科学的根拠をもとに最終的なジャッジをするという流れは着実に出てきている状況です。

ちなみに、子供のころはどんなお子さんだったのでしょうか。今につながる原体験のようなエピソードがあれば教えてください。

例えば、子供のころに遊んでいたドラゴンクエストでは、平地よりも森や岩山の背景グラフィックの方がモンスターの出現率が高い、なんてうわさが当時友達の間で流れていました。そこで、本当かどうか自分で検証するべく、ストップウォッチを片手に何度敵が出てきたのかを測定した結果、確かに森や岩山のところの方がモンスターに遭遇しやすくなっていました。つまり、レベルを上げるときはや岩山を効率よく回った方が時間の短縮につながるわけです。自分が初めてやったデータ分析の原点がここにあるかもしれません。