企業・教育現場の第一線で活躍する人材が語る、
データサイエンティストの“想像と現実”

kiji_pc_visual_case_study_15_shigauniv_ob.png kiji_mob_visual_case_study_15_shigauniv_ob.png

統計学や情報工学などの知見を活かして、ビッグデータをはじめとする各種データを収集・加工・分析し、課題解決や意思決定につなげる、データサイエンティストという仕事。人工知能や機械学習が社会的注目を集める昨今、関連する職種としてよく見聞きするようになった。とはいえ、いかなる経歴や目標を持つ人がデータサイエンティストを志し、どのような業務に携わっているか、という実際の姿を目にする機会はまだまだ限られている。
そこで今回、株式会社帝国データバンクでデータサイエンティストとして活躍するかたわら、国立大学法人滋賀大学などで教鞭を執り、後進の育成にも取り組んでいる大里隆也氏と、同大学データサイエンス研究科を卒業後、2021年に株式会社日本総合研究所へ入社し、データサイエンティストとして実務に携わる百瀬耕平氏に、「データサイエンティストの想像と現実」をテーマに話をうかがった。

▼プロフィール
大里隆也氏
株式会社帝国データバンク プロダクトデザイン部プロダクトデザイン課 課長補佐
国立大学法人滋賀大学 データサイエンス・ AIイノベーション研究推進センター 特任講師

百瀬耕平氏
株式会社日本総合研究所 データ・情報システム本部(情報活用システム) データサイエンスグループ
※役職や所属は取材時のものです。

▶プレスリリース:2023年06月08日セゾン情報システムズ データサイエンティスト育成支援の経過公表

データサイエンティストは「意思決定を手助けする裏方の仕事」
近年は誰でも学ぶ可能性のある“民主化”した分野に

まずはお二人の経歴や現在の所属について簡単にご紹介ください。

大里 大学・大学院にて数学を専攻し、2011年に新卒で帝国データバンクへ入社しました。同社で企業倒産を予測するモデルの開発や大学との共同研究に携わった後、企業派遣として大学院博士課程に進学、2019年に修了しました。同年、滋賀大学と帝国データバンクで共同研究拠点「DEMLセンター」を設立、私も滋賀大学の特任教員のポストをいただき、学生指導や企業との実践的な共同研究を行っています。

百瀬 大学の経済学科を卒業後、2019年開設の滋賀大学データサイエンス研究科に1期生として入学しました。修了後に大手金融グループの総合情報サービス企業である日本総合研究所へ入社し、データ分析基盤の保守運用を1年半ほど担当しました。2022年秋から、金融グループ全体の案件に関わる部署として新設されたデータサイエンスグループに所属しています。日本最大級の金融グループで直接金融経済に関わりたいデータサイエンティストにとっては、とてもやりがいのある仕事です。

そもそもデータサイエンティストとはどういう仕事なのですか?

大里 最近、ChatGPTなどの人工知能がよく話題になっているように、データサイエンティストは華々しいイメージがあるかもしれませんが、実際には裏方にまわることの多い仕事ですね。データを駆使し、数字によって事実を示し、人の意思決定や行動の効率化を手助けしています。根拠となるような数字を出すためには、そもそもどんな指標に活用の可能性があるか、それをどう作成していくか、というディスカッションを意思決定者と行うことが重要になります。データサイエンティストは、データにもとづく処理の設計などの場面で活躍しているため、表に出ることはあまりないのです。

お二人がそういう仕事を志したきっかけや理由は?

大里 私の場合、きっかけは「野球」ですね。ポジションはキャッチャーを務めることが多かったのですが、中学のときに監督から「野球は確率論だ」と指導されて以降、その考えがずっと頭にありました。大学では当初、教員志望で数学を専攻したものの、統計学の講義を通じて「野球をデータ分析したらおもしろいのでは?」と考えるようになり、大学院では野球のデータを使った研究に没頭しました。修士1年から野球データを利用し、修士2年のときには、野球データを収集する企業で1年間インターンとして野球データ活用に取り組みました。そういう経緯で、データを使ってものごとをよりよくする仕事に就きたいと考えるようになり、今に至っています。

百瀬 私は大学の経済学科で勉強のおもしろさを感じて、大学院進学を考えたのですが、かといって研究職を目指しているわけではなく、進路について迷っていました。そこで、講義を受けていた統計学の有名な教授に相談したところ、実務を見据えた修士レベルの教育を受けるというのは海外では一般的で、キャリアとしていい選択肢だと思う、と。その点で滋賀大学データサイエンス研究科はすばらしい環境でおすすめだよ、とアドバイスしていただいて、進学を決めました。

経済学専攻からデータサイエンティストを目指すというのは進路として一般的なのですか?

百瀬 主流ではない気がしますが、計量経済学などは非常に近い分野ですし、最近ではかなり増えていると思います。数学が得意で大学院で専攻していた人が理論レベルでデータサイエンスに取り組むパターンが昔からある一方、現場で実務レベルの経験を積んだ人が学び直してドメイン知識とかけ合わせるというパターンも近年多くなっています。その意味でデータサイエンスは、どういう経歴の人でも学ぶ可能性のある、“民主化”した分野になってきていますね。

大里 そうですね。滋賀大学データサイエンス研究科の学生約40名のうちの半分程度は、企業から派遣された社員で、所属企業の具体的な課題の解決を目的として研究を行っています。学生の派遣が企業の課題解決に直結するようになったのは、データサイエンスの活用の形としてとてもいいことだと感じています。

大里先生は滋賀大学でどんなことを教えていますか?

大里 帝国データバンクでの業務で、地域経済分析システム(RESAS)という、内閣府と経済産業省が共同開発したオープンシステムの開発に携わりました。実は、e-Stat(政府統計の総合窓口)に搭載されている公的統計は人間が見やすいデータの形になっていますが、システムが読み込みやすい形にはなっていないため、システムに読み込める形式にデータを前処理する「データ研磨」業務を担当していました。このプロジェクトを通じて、改めて、データサイエンティストはデータ研磨に時間を費やし過ぎており、データの活用という重要な部分に時間を割けていないことを強く認識しました。データの研磨に時間を取られてしまいがちなのは、データサイエンティストにとって必須のスキルであるにもかかわらず、大学などで体系的に学ぶことが少ないから、という背景があります。そこで私は滋賀大学で、データの研磨に関する講義を毎年行い、そういう状況を少しでも改善しようとしています。

百瀬さんは滋賀大学でどんなことを学びましたか?

百瀬 講義だけでなく、同級生と投資コンテストに出たり、勉強会に参加したりして、データサイエンスからデータエンジニアリング、ビジネスにおける価値創出まで、幅広い知識や技術を身につけました。また在学中、滋賀大学と帝国データバンクが共同運営する研究施設「DEMLセンター」に勤務し、高機能材料の販売・加工を手がける企業との配送最適化に関する共同研究に参加しました。
その中で私が担当したのはデータ収集・加工で、その作業をセゾン情報システムズのDataSpiderを使って自動化しました。会社に入ると、そのようにローコード・ノーコードでデータ収集・加工を自動化したい場面は非常に多く、それを学生時代に経験できたのはとてもありがたかったですね。

DataSpiderを授業で使ってみて感じたことは?

百瀬 データ操作をしたいだけなら、正直なところプログラミングのほうが早くて簡単だと感じました。しかし、さまざまなことをしようとすると手間と時間がかかってしまうところを、DataSpiderならGUIで簡単にできてとても楽でした。普段プログラミングをしない方への説明や引継ぎも楽だと思います。
また、製品の使いやすさは、製品それ自体だけでなく、サポートも大きな要素を占めると思います。その点、セゾン情報システムズのマーケット部や開発部の社員は優秀で話しやすい方ばかりでした。学生相手でも気さくに、対等に接してくださる姿勢を、私も社会人として見習わなければと思っています(笑)。

社会人になってもDataSpiderを使うシーンはありそうですか?

百瀬 PoC(概念実証)でいい結果が出ても、そこから現場で実運用するまでのハードルは高いケースが多いと思います。DataSpiderを使うことで、そのハードルを下げられることは多そうです。

滋賀大学・DEMLセンターでの経験で特に印象に残っていることは?

百瀬 もともと文系で開発に疎かったので、セゾン情報システムズのエンジニアの方からのアドバイスがとても勉強になり、社会人になってからも役立っています。中でも印象的だったのは、打ち合わせでエンジニアの方同士の「これはこうでしょ」「いやいやこうでしょ」といった議論がしばしば起きたことです。優秀なエンジニアの方ばかりでしたが、考え方や価値観という点では人によってまるで違うので、議論の中から最適な方法を探して実装することが大切なのだ、ということを学びました。

卒業後もOBとしてコミュニティなどでセゾン情報システムズと関わっていきたいですか?

百瀬 はい、ぜひ。先日も多くのHULFT・DataSpiderユーザーが参加する「DMS Cube祭り2023」に登壇させていただき、さまざまな方と交流ができてとても有意義でした。視野を広げるためにも、業務以外のコミュニティに関われるのは大変ありがたいと思っています。

case_study_15_img_01.png

滋賀大学データサイエンス研究科 卒業
株式会社日本総合研究所 百瀬耕平氏

 

現場で求められるのは「人を動かす説明力の高いもの」や
「安定的に保守運用できるもの」を作れるデータサイエンティスト

滋賀大学・DEMLセンターで学んだことは、現在の仕事でどう活かされていますか?

百瀬 データサイエンスやデータエンジニアリングの知識はもちろんですが、DEMLセンターで提携企業の社員や大学の先生、同期、後輩など、いろいろな方と一緒に案件を進めたことが、就職後を先取りするような経験として業務で活きている実感があります。入社後、物怖じせずに実際の案件にすんなり入れたのは、先ほどのDataSpiderを使った実務など、通常なら社会人になってから学ぶことを学生時代に経験できたからだと思っています。
それともう1つ、大里さんをはじめ、データサイエンス研究科の先生・同期・後輩や、DEMLセンターで出会った幅広い年代・業種の方たちとは今でも頻繁に交流があって、「そっちの会社はどうなの?」みたいなことを気軽に聞けるのが楽しく、仕事上でもすごく活きています。

データサイエンティストとして働く中で、どんなことに喜びや達成感を覚えていますか?

大里 やはり一番の喜びは、ディスカッションを通じて算出した数字が実際に活用され、人が幸せになるのを見ることですね。経済産業省が、支援する企業を地域未来牽引企業として選定する際、私の作ったデータや指標の組み方を採択して意思決定されたときは本当に嬉しかったです。人の行動に大きな影響を及ぼせるのが、データサイエンティストという仕事の醍醐味だと思います。

百瀬 私はデータサイエンティスト職に就いてまだ数か月なので、そういう大きな喜びを感じるのはこれからだと思いますが、おもしろいな、すごいなと感じることはたくさんありました。たとえば、社内からあることを予測したいという相談があって、丁寧に予測モデルを組んでみたところ、よくわからないところが出てきたので、逆に私から依頼者側に相談してみたのです。すると、データサイエンスに詳しくない方からも、「実はあの案件と連動しているのでは?」「あのデータが使えるのでは?」という意見がどんどん出てきて、それならこう分析してみよう、と考えが進みました。そういう現場の視点やコミュニケーションから方向性が見えてくるデータサイエンスはやはりおもしろいな、と改めて実感しました。

逆に、データサイエンティストになる前の想像と違うことや、うまくいかないと感じることは?

大里 大学院での研究では、1つの事象に対して、予測するための数式を数%の精度の違いで何百通りも作り、どの予測式がもっともらしいかを研究していました。ところが、会社に入ってから求められるのは、数%の精度の違いより、そのモデルに人を動かすための説明力があるかどうかでした。たとえば、企業の倒産予測モデルを使って「あの会社は危ないらしい」と営業担当に説明するとき、単に「人工知能がそういったから」と伝えても、納得させるのは難しいでしょう。それに対して、「最近焦げつきがあり、信用度が低下している」というファクトを一緒に提示すれば、理解を得やすくなります。
単純な予測精度ということなら、人工知能による学習系のモデルのほうが当然高いわけです。しかし、実際の現場では、予測精度を多少犠牲にしてでも、説明力の高い、人を動かすためのモデルを開発する必要がある。入社当初、そういう面でギャップを感じました。

百瀬 社会人になってまず実感したのは、すごいものを作るより、安定的に保守運用できるものを作るほうが難しく、重要だということです。学生時代には、高い専門性や技術力ですごいものを作ることに憧れていました。ただ、個人の能力でそういうものを作っても、仮にその人がいなくなってしまったら、保守運用で皆を困らせ、結果的に会社にとってマイナスになることは十分にあり得ます。だから、社内の人材や環境を総合的に見て、安定的に保守運用できるものを作る能力を磨くことが大切だと感じています。
もう1つ強く感じているのは、当然ですが、データサイエンティストは一生勉強を続ける必要がある、ということです。それを前提にデータサイエンスグループでは、資格取得や研修・学会参加の支援制度が設けられています。私自身も、会社の支援で業務外に国立情報学研究所の社会人講座を受けています。
一方、いい意味でギャップを感じたのは、思っていたより働きやすいという点です。金融グループの企業なのでお堅い職場を想像していたのですが、ドレスコードフリーでフレックスタイム制、在宅勤務も可能。上司や同僚、案件の関係者にはフランクで好奇心の旺盛な方が多く、とても楽しい職場環境です。

データサイエンティストとして今後取り組みたい、実現したいと考えていることは?

百瀬 大手金融グループに入ったので、ここでしか取り組めないような案件にどんどん挑戦したいと思っています。また、昨今はモデリングだけでなく、データ分析基盤の構築が重要になってきているので、そういう案件に積極的に取り組んで、システムエンジニアリングの能力も伸ばしていきたいと考えています

大里 私はすでに多くの案件を経験し、社内ではデータサイエンスの第一人者のような立ち位置となっており、役割がプレイヤーからマネージャーへ移行しつつあります。社員のデータサイエンティストの育成やデータサイエンティストの採用で人材を確保し、データサイエンティストが社内で活躍できる環境・機会を作っていくことが、これからの私の仕事だと思っています。たとえば、連携している大学とのインターン実施や、大学教員が大学の所属と並行して会社に所属できるクロスアポイントメント制度を社内で整備するなどを行っていきたいです。データサイエンティスト育成の旗振り役として活動し、帝国データバンクの取り組みを通じて、社会をよりよくしていきたいと思っています。

case_study_15_img_02.png

株式会社帝国データバンク /
滋賀大学 データサイエンス・ AIイノベーション研究推進センター 特任講師
大里隆也氏

 

最後に、データサイエンティストを目指している方に対して、経験を踏まえたアドバイスやメッセージをお願いします。

百瀬 偉そうなことをいえる立場ではありませんが、データサイエンティストはやはり基礎学力がすべてだと思うので、学生の間に徹底して勉強するのがいいと思います。先ほどお話ししたように、データサイエンスは今や特定の経歴の人だけのものではなく、ビジネスに携わる人全員が学ぶべき分野になってきています。一方で、社会人になってから勉強するのはなかなか大変ですから、可能なうちにできるだけ詰め込んでおくことをお勧めします。

大里 確かにその通りですが、目的なしに基礎を勉強し続けるのは難しいので、やはりモチベーションを持つことが大切と私は考えています。データに関する知識やスキルをいくら身につけても、取り組むテーマのドメイン知識を持っていないといい分析はできませんし、意思決定する方や実際の現場の方とも適切なコミュニケーションを取ることができません。この分野のこういう課題をこんなデータで解決したい、というモチベーションが必ず必要になるのです。 これからデータサイエンスを学びたいと思っている方は、勉強を続けていくためにも、自分自身はこういう分野で生きていきたい、データをこのように使って世の中をよくしていきたい、というビジョンを持つところから始めるのがいいのではないでしょうか。


■ セゾン情報システムズ公式youtubeチャンネル「シス☆スタ」

◆シス☆スタ【データサイエンティストの先輩が登場!学生さんが知りたい、想像と現実のちがいとは?】◆
セゾン情報システムズ公式youtubeチャンネル「シス☆スタ」にて、
滋賀大学データサイエンス研究科を卒業後、2021年に株式会社日本総合研究所へ入社し、データサイエンティストとして実務に携わる百瀬耕平氏のインタビュー動画をご紹介しています。