不動産投資をより便利に、上質に。いかに人が解釈しやすいモデルにできるかが鍵
〜 価値算出AIの着眼点 〜

kiji_pc_visual_case_study_18_fdua_03.png kiji_mob_visual_case_study_18_fdua_03.png

「AIを業務に取り入れたい」「経営としてAIに期待している」、AIに期待を寄せる人、企業は多い。実際に活用している人、企業はどのような視点で立ち上げ、どのように構築し活用しているのか。
AIの活用、成功パターンを紹介している本連載。第三回となる今回は、2009年設立、オンライン住宅ローンサービスや不動産投資サービスを手掛ける株式会社MFSのチーフアナリスト堀江勇介氏にMFSでのAI活用事例、如何にAI活用を成功に導いたのか、お話をうかがった。

▼プロフィール
一般社団法人金融データ活用推進協会 企画出版委員会
株式会社MFS プロダクト開発部リサーチ&アナリティクスチーム
堀江勇介氏
※役職や所属は取材時のものです。

より快適に利用できるサービスを目指し、価値算出AIに着目

まず自己紹介をしていただけますか?

私は大学を卒業後、地方銀行の市場部門で国内外の債券など有価証券の運用業務に従事し、その後MFSに転職しました。現在はリサーチ&アナリティクスチームにてAIを活用したサービス開発のほか、金融や不動産市場の分析、住宅ローンに関する調査や、今回お声かけいただきました書籍『金融AI成功パターン』など各種執筆を行っています。

株式会社MFSについて教えていただけますか?

弊社は住宅ローンの借り換えをオフラインで提供するビジネスが祖業でしたが、その後オンライン化を行いました。現在はオンライン住宅ローンサービス「モゲチェック」、不動産投資サービス「INVASE」の2事業を展開しています。

弊社の経営陣は国内外問わずの投資銀行、証券会社出身者で、CEOとCOOは住宅ローンの証券化など業界にとって新しい試みを切り拓き、先導してきました。そのほかのメンバーも金融業界の出身者が多く、ファイナンスのナレッジとテクノロジーを組み合わせたビジネスを展開しています。

MFSがAI活用を始めた背景についてお話しいただけますか?

「モゲチェック」では以前からデータ活用をすすめていました。簡単に紹介すると創業以来の住宅ローン媒介で培ったノウハウと主要銀行における大量の審査結果データを活用し、「住宅ローン審査に通る確率」、つまりは融資承認確率の予測モデルを開発しました。本モデルはすでにサービスインしており、融資承認確率やユーザーの属性情報、希望条件を踏まえてその人にピッタリの住宅ローンをレコメンドするサービス、「モゲレコ」として提供しています。

モゲチェックだけではなくINVASEでもAIを活用しユーザーによりよいサービスを提供できないかと考え、今回お話しする「価値算出AIパターン」の開発を行いました。

「価値算出AI」とはどのようなものですか?

価値算出AIとは金銭的な価値を算出する機械学習モデルのことです。INVASEでは不動産の価格予測を行っていますが、そのほかにも保険金の支払額予測や、リース商品の残価予測、また融資限度額予測などあらゆる”価値”算出に活用が可能です。

本来であれば、こうした価値算出はその分野の専門家が様々な観点から調査、計算を経て行うことが多いですが、金融系サービス共通の特徴として「より速く意思決定したものが契約を取れる」ことが往々にしてあります。

つまり、価値算出に時間をかけすぎると競合他社に契約を奪われるリスクがある。そもそもその分野の専門家、人材を集めることができないリスクもありますし、人によって価値算出の基準が異なってしまうということもあります。こういった問題を解決できるのが価値算出AIです。

AIの前に、まずは不動産投資の特徴を洗い出す

今回お話しいただける「INVASE」について教えていただけますか?

INVASEは不動産投資ローンの借入、借換、購入の申し込みから審査完了まで手続きできるwebサービスです。不動産投資ローンの借入可能額を判定するバウチャーサービスや不動産投資ローンの借り換えサービスを提供しており、その他にもユーザーが所有する物件の売却をお手伝いすることも可能です。昨年、資産性を重視したコンサルティングを行う不動産販売仲介会社のコンドミニアム・アセットマネジメント株式会社を子会社化したことで、自社で投資用不動産の販売も行えるようになりました。

fdua_03_Fig01.png

【動画スライド8から引用】
INVASEの従来サービス
*記事の文末に解説動画をご紹介しています。

「不動産投資」についても教えていただけますか?

不動産投資は、金融機関からローンを借りて物件を購入し、それを賃貸に出すことで賃料収入を得るのが一般的です。ただし、物件を割高に買ってしまってはインカムゲイン・キャピタルゲインといった不動産投資の成功から遠のいてしまいますので、「物件を適正な価格で購入できるか」が重要です。

case_study_18_img_03.png

不動産は、同じものが世界に2つとないユニークな資産ですので、株価のように誰がみても一意に決まるような値がありません。収益還元法や取引事例比較法といった計算方法は評価者による主観が入り込む余地がありますし、過去の成約事例などが一元管理されたデータソースも日本にはありません。だからこそ、統計的に不動産価格を評価できる価値算出AIに目を向けました。

INVASEでは、不動産の中でもサラリーマンなど多くの人にとって最もポピュラーである、都心の単身者用区分マンションにおける物件価格をAIで予測するモデルを開発しています。

fdua_03_Fig02.png

【動画スライド10から引用】
不動産賃貸による資産運用手法
不動産には評価尺度が乏しく、機械学習による統計的評価は有効
*記事の文末に解説動画をご紹介しています。

データソースの下準備、表記のゆらぎ、着地点の精査

INVASEの価値算出AIについて詳しく話していただけますか?

INVASEの価値算出AI、つまり「物件価格を予測するモデル」を構築するため、学習データとして自社のデータベースに格納された物件データを利用していますが、INVASEのユーザーが登録した物件データだけではなく、物件情報サイトなどの外部データも使用しています。

注意するべき点は、自社データベースと違い、外部データは表記ゆれやゆらぎが多数存在していることです。たとえば物件サイトに掲載されているデータは、データとして処理されることを前提とした型になっていないことが多いので、AIで評価しやすいデータ型に加工したり、表記を統一するなどの前処理が重要です。住所であれば「千代田区千代田1−1−1」や「千代田区千代田1丁目1番1号」、物件名が「Maison、MAISON、メゾン」など。また部屋番号も「201号」や「2-1」と表記するケースもあり、これらはゆらぎとなります。こうした表記を、住所であれば郵便番号に変換したり、所在階のみ記載するなど前処理を行っていきます。

ちなみに下図は今回の価値算出AIに使うデータセットのイメージです。

fdua_03_Fig03.png

【動画スライド4から引用】
価値算出AIのデータセットと注意点
ターゲットとなるデータと、その商品の属性情報を用意
あくまで学習に用いたデータに基づいた予測となるため、本当に算出したい価値は何かを考える必要がある
*記事の文末に解説動画をご紹介しています。

価値算出AIをつくる上で重要なのは、本当に算出したい価値は何なのか、ということです。例えば、上記の図で同じ物件に対してAさんとBさんという買い手がいたとします。Aさんは3,000万円で成約したものの、実はBさんは3,200万円で購入しようと考えていた。この場合、成約したAさんのデータのみ残り、200万円多く考えていたBさんはデータとして残りません。つまり、物件の実力値は3,200万円だったかもしれませんが、実際には成約事例である3,000万円がAIの学習データとなってしまいます。

この例のように、集めたデータによってAIの予測値は変わってしまうため、本当に算出したい値は何で、そのためにどういうデータを準備すべきか、を考える必要があります。

表記のゆらぎ、「本当に算出したい価値とは?」……考えることが多いですね。

データ加工に関しては「間取り」も良い例となります。例えば、人が見れば「ワンルーム」と「1R」が同じものだと認識できますが、AIはそれが同じものを指すと理解できない場合があります。こうした表記を1Rや1DKなど統一したうえでカテゴリ値とする方法(A方式)のほか、間取りの要素を分解して数値で表現する方法(B方式)も考えられます。たとえば1Kであれば部屋数は1、キッチンも1つなので、「部屋数、リビング、ダイニング、キッチン、その他」とデータ列を分けて「1,0,0,1,0」とするイメージです。

こうしたデータの前処理方法は多々ありますが、予測の「精度」に着目して選ぶと良いでしょう。弊社でもA方式、B方式でそれぞれ整理したデータを使ってAI学習パターンを構築。結果、A方式の精度が高かったため、A方式に決定しました。

不動産投資の価値算出AIではA方式が最適と言うことですか?

それは商材や顧客によって変化します。INVASEでA方式のほうが高い精度が出たのは、「単身者向けの区分マンション」を対象にしたモデルだからだと考えています。単身者向けだと間取りのパターンはそれほど多くないためです。もしファミリータイプのマンションの場合は間取りの情報量が増えるためB方式のほうが高い精度が出る可能性があります。

商材や顧客の志向によってデータの下準備から工夫をしていくことができるんですね。

AIはアイデア次第で活用方法が広がります。馴れてきたら顧客や商材だけではなく、自社の「こだわり」も考慮してみるのも良いと思います。弊社では「最新の不動産市況を反映したAIモデル」であることをモットーにしているので、月次でデータ取得からモデル構築を行いました。

ここで課題となったのが収集できるデータ量が月によって変化してしまうこと。つまり、月によってモデルの精度が変わってしまい、予測結果がブレてしまうことが発生しました。 そこで一定のデータ量を担保するために直近3ヶ月分のデータを使うことと、より新しいデータには重み付け、つまりは重要度を設定しました。重み付けは、具体的には直近のデータ行をコピーし、より新しいデータをAIが多く学習できるようにしました。こうしてデータ不足によるブレの軽減と、「最新の市況を反映する」というコンセプトを両立しました。

また、モデル構築時に行う交差検定のパーティショニングでは同じデータの行同士が同じパーティションに入っている必要がありますので、データが同じであることを識別するための列を追加するという処理も行っています。

fdua_03_Fig04.png

【動画スライド13から引用】
最新の不動産市況を考慮するため、取得日データを使って重み付け
交差検定のパーティショニングのため、列を追加するなど工夫
*記事の文末に解説動画をご紹介しています。

人間の感覚やビジネスの実態と大きな差が出ないよう調整していく

そしてモデリングです。本件も鍋倉さん(解説記事リンク)、橋詰さん(解説記事リンク)と同様AutoMLを使って構築していきます。AutoMLツールであれば細かい設定をしなくてもある程度のモデルが できますが、当社では単調性制約などいくつか細かい設定を行いました。単調性制約とは、ビジネス仮説や現場の感覚など、ドメイン知識に基づいて特徴量とターゲットの方向性を明らかにする制約です。

具体的に説明しますと、不動産は面積が広いほど価格が高くなり(単調増加)、築年数が古いほど不動産価格が安くなる(単調減少)ことはみなさんも感覚的に理解されていると思います。単調性制約とは、このような特徴量とターゲットの関係性を明確にすることです。学習データの偏りや局所的なデータ不足によって、このような関係性をAIがうまく表現できないことがあるので、いくつかの特徴量で単調性制約を入れてモデルを矯正しました。ドメイン知識や人間の感覚と大きな乖離が出ないよう、人間がAIの学習をサポート・コントロールするということになります。

fdua_03_Fig05.png

【書籍P96 図表3-6 単調性制約 から引用】
専有面積や築年数といった特徴量で、特徴量と予測値の関係性がトレンドに逆らった動きを見せた(上図)ため、必要に応じて単調性制約をかけることで学習データのバラつきを軽減する(下図)

価値算出AIは人に勝るものではなく、サポートするものなんですね。

不動産の場合は、どんなに精度の高いAIモデルができて価値を評価、算出できたとしても、住宅設備の劣化度合いなどデータ化が難しい部分で、ある程度人の目によって価格調整されることは免れません。

そのため、当社では実際の売買価格と大きな差が出ないことを目指し、評価指標には平均絶対誤差率であるMAPEを採用しました。MAPEは、予測値から正解値を引いた「誤差」を計算し、誤差と正解値を割った「絶対パーセント誤差」を算出します。これにより、正解値にどれだけ近い予測を出せるのか?を確認、調整していきます。弊社では、社内のビジネスサイドと合意形成する中で、MAPE10%以下であることを目標値としました。

ありがとうございました。今回は鍋倉さん(解説記事リンク) 、橋詰さん(解説記事リンク)の事例とは異なる印象を受けました。

書籍『金融AIパターン』では金融業界における各リーディングカンパニー様がそれぞれのAI成功パターン、事例を紹介しています。その中でも弊社は、業務フローの効率化などではなく、一般消費者、コンシューマ向けにAIを活用しているという特徴があります。今後もINVASEモゲチェックともに、データを活用しユーザーサイドに立ったサービスを提供していきたいと思います。今回の事例が、同じようにエンドユーザー向けにAI活用を考えている企業、担当者様の参考になれば幸いです。

金融データ活用推進協会 著
『金融AI成功パターン』
大好評 発売中!

fdua_book.jpg


■ 「FDUA 金融データ活用推進協会タイアップ企画」動画

金融データ活用推進協会 企画出版 書籍『金融AI成功パターン』”第三章 価値算出AIパターン”
セゾンテクノロジー公式youtubeチャンネルにて、
第三章の執筆を担当した株式会社MFS 堀江勇介様の解説動画をご紹介しています。
併せてご覧ください。



※2024年4月 セゾン情報システムズは『セゾンテクノロジー』へ社名変更いたしました。
 動画中は撮影時の社名を使用しています