国立大学法人滋賀大学 様
滋賀大学の産学連携プロジェクトにセゾンテクノロジーが参画
DataSpiderでプログラミングの効率化と見える化を支援
- 業種・業態
- 教育
- 導入製品
- DataSpider Servista
- キーワード
- データ変換 / 運用負荷軽減 / 開発工数削減 / 見える化 / データ活用
滋賀大学と株式会社帝国データバンクの連携協定により、2019年7月に設立された「Data Engineering and Machine Learningセンター(以下DEMLセンター)」では、データ解析の精度を高めるために欠かせないデータ研磨・加工といったデータマネジメントをテーマに据え、オープンデータ等を用いた実際的&学際的研究に取り組んでいる。だが、プログラミングによるデータ研磨・加工は効率が悪いうえに、卒業・修了で入れ替わるスタッフ間の引き継ぎなどが課題に。課題解決に向け白羽の矢を立てたのが、ノンプラグラミングでのデータ研磨・加工を実現する「DataSpider」であった。
お客様の課題
データ研磨・加工のプログラミング開発は、研究支援者(学生)にとってハードルが高いうえに、可読性が低く毎年のスタッフ入れ替わり時の引き継ぎが困難
導入効果
データ研磨・加工の
プログラミングを
効率化
フローの
見える化
でスムーズな
引き継ぎを実現
研究成果の
横展開・二次活用
が容易に
データ研磨・加工プログラミング開発の効率と可読性の低さが課題に
滋賀大学が注力する産学連携研究プロジェクトのひとつが、株式会社帝国データバンクとの連携協定により2019年7月に設立されたDEMLセンターである。設立以来、企業や役所が公開しているビッグデータを用い、「コロナ禍の倒産件数予測モデル」「最適配送ルート設定・配車割り振りの自動化」など、数々の研究成果を上げているDEMLセンターだが、設立当初の課題について「大学の講義では、用意されたキレイなデータを元に分析手法や考え方を教えますが、現実のデータは、形がバラバラであちこちに散在しており、分析・解析よりも、集めてきたデータの研磨・加工に時間がかかるのが普通です。大学の講義では、データ研磨・加工を自動化するプログラミングについても教えていますが、時間の成約もあり限界があります、DEMLセンター設立の狙いには、こうした学術と現実社会のギャップを埋めて、より実践的なスキルを身につけたデータサイエンティスト人材を育成することもあります」と語るのは、データサイエンス学部 教授の杉本 知之 氏だ。
このほかDEMLセンターでは、12名の研究員に加え、データ研磨の集中講義を受講し一定レベルのノウハウを取得した学生を20名近く研究支援者として雇用しているが、これらスタッフは年度ごとに大きく入れ替わりそれぞれ業務引き継ぎが発生。新任者は前任者のプログラムを解読することからはじめなければならず、極めて非生産的だ。短期間ですぐれたデータサイエンティストを育成しつつ成果をあげていくうえで、プログラミング開発の非効率性はもとより、属人的で極めて低い可読性も問題となっていた。
プログラミングの効率化と見える化に向けてDataSpider活用を決定
一方、帝国データバンクから派遣され、データサイエンス教育研究センターの特任講師を務める大里 隆也 氏は、DEMLセンター開設の狙いについて「帝国データバンクが専門とする企業データ以外の、世の中一般の膨大なデータについて分析ノウハウを蓄積したいと考え、様々な企業や自治体と広くつながることのできる同センターの設立を働きかけました」と語るが、こうした実データはデータ形式などがバラバラで、分析を進めるうえでデータの研磨・加工という前工程は避けて通ることができない。このため、前述の手動でのプログラミング開発の効率や可読性の低さによる引き継ぎの難しさといった課題の解決を迫られる。
この問題に対し、DEMLセンターが白羽の矢を立てたソリューションが「DataSpider」であった。「DataSpiderは、帝国データバンクのデータエンジニアリング案件を通じて知りました。これまで2か月かかっていたデータの研磨・加工作業を2日で成し遂げることができて驚きました。また、ノンプログラミングで誰でも簡単にデータ研磨・加工の仕組みを作ることができ、GUIベースのアイコンは可読性にすぐれることから、“フローの見える化”を進めるうえでもDEMLセンターに導入したいと思いました」(大里氏)
帝国データバンクからの提案を受け、2019年12月、新たに株式会社セゾンテクノロジーがDEMLセンターに参画することに。「DataSpider」の活用支援を通じて、実践的なデータ研磨・加工の技術やノウハウの提供を受けることとなった。
DataSpiderによるフロー化でアルゴリズム改修が容易に
DEMLセンターでは、開設以降毎年、セゾンテクノロジーの協力を得て学生向けにDataSpiderを紹介するオンライン研修を実施しているが、講義で教わることのないDataSpiderのようなツールは学生にとっても新鮮に映り、好意的な意見が多いという。「特に、統計データ分析コンペティションなどに参加したことのある学生の場合、“チームで協力して作業することの重要性”を知っており、そうした学生からは、DataSpiderを利用すればチーム内での情報共有がスムーズにできて作業効率が上がりそう…といった声が出ました」(杉本氏)
2020年10月に成果を発表した、能勢鋼材株式会社(本社・大阪)との共同研究でも、データ研磨・加工の前処理において同製品が活躍。保有する15台のトラックによる一日平均250の配送先への配送最適化アルゴリズムを構築し、最適化ソフトウェアとして同社に納入している。この成果についても杉本氏は「ここで培った技術は、運送業はもとより、自社製品の配送業務を抱える企業にあまねく提供できればと考えています。その際、個社企業の条件に合わせたデータ研磨・アルゴリズムの調整が必要になってくると思いますが、ロジック部分をDataSpiderでフロー化することで、比較的容易に個社の都合に合わせることができるようになります」と語っている。
この春、データサイエンス学部の第一期生が社会に羽ばたき、はじめてスタッフの大きな入れ替わりを迎えたDEMLセンター。学部長の竹村 彰通 氏は、DEMLセンターにおけるこれまでの取り組みやその意義について、次のように語る。「分析するための前処理としてのデータ研磨・加工は、現実社会ではかなり大きなウェイトを占めます。DEMLセンターのプロジェクトに研究支援員として関わることで、その重要性や大変さを理解することができ、卒業後データサイエンティストとして活躍していくうえで貴重な体験になると思います。」
USER PROFILE:国立大学法人滋賀大学
近江の歴史と文化を礎として1949年に発足。教育学部と経済学部の文系2学部に加え、2017年4月に国内大学としてはじめてデータサイエンス学部を新設。『Society5.0時代の分離融合大学』を掲げ、数理的思考やデータ分析・活用能力を持ち、データから価値を生み出すことのできる人材の育成を目指す。2019年には「データサイエンス研究科(大学院)」を追加。株式会社帝国データバンクなど、様々な企業・自治体との産学官連携や大学連携にも注力、学術研究の枠を越えた幅広い領域におけるデータ利活用を推進している。
HULFTやDataSpider等のユースケース集「HULFTユースケース80選」をダウンロード
-
※
所属・役職・社名等は取材当時のものとなります。
その他の導入事例
EAIソフトウェア「DataSpider Servista」
こちらから30日間無料でお試しいただけます。導入検討の際にぜひご活用ください。
製品や導入についてご不明な点はお気軽にお問い合わせください