dataway

パーソナルデータ利活用の未来について考えるメディア

芝麻信用の信用スコアの利用データとスコアリングの仕組み

f:id:show_motto:20190204224134p:plain 日本でも「信用スコア」が盛り上がってきているが、その話題になるといつも引き合いに出されるのがアントフィナンシャルの「芝麻信用」だ。

個人への融資からスタートし、今ではスコアが一定以上の場合にはデポジットを免除するなど様々な生活シーンへの利用も活発となっており、世界で最も利用されている信用スコアと言っても過言ではないだろう。

信用スコアの設計を考える上で、その芝麻信用の仕組みから学ぶことは少なくないはずだ。

そこで、本記事では、その「芝麻信用」が実際にどのようなデータを利用して、どのようにそのスコアリングの精度を担保しているのかについて、解説をしていこう。

「信用スコア」について詳しく知りたい方は「信用スコアとは?仕組みとサービス事例を日本中国米国中心に徹底まとめ」をご覧ください。

利用データの内訳

芝麻信用では、「アリババ・アントフィナンシャル系列のグループのサービスで取得するデータ」「数百ものデータパートナーから取得するデータ」の双方を利用してスコアリングをしている。

図式化すると、以下のようになっている。

芝麻信用のデータ構成
芝麻信用のデータ構成

これらのデータがそれぞれどの程度の重み付けなのかについては公表されていないが、利用データの数でいうと、90%以上がアリババ・アントフィナンシャル系列外からのデータとなっている。

芝麻信用というと、「アリババ経済圏で取得したデータを元に信用をスコアリングしたもの」というふうに捉えられがちだが、実際には、アリババやアントフィナンシャル経済圏のデータも利用しつつ、その一方で、様々な外部データを利用しているというわけだ。

データパートナーのデータの中には、最高人民法院の信用失墜被執行者リストや裁判所が関与した経済紛争の判決データといった、信用に直接的にヒットしてくるようなデータも含まれており、信用スコアの信頼性向上に大きく寄与してくれている。

ポジティブにはたらくデータ

では、様々なデータが利用される中で、ポジティブにはたらくデータはどのようなデータなのか?

リストであげていくと、以下のようになる。

  • 教育部の学歴・学籍
  • 各地の公共料金納付履歴
  • 社会保険
  • 積立金
  • 納税等

きちんとした大学を出て、日常的な支払いを滞りなく行っていることが評価される。

ネガティブにはたらくデータ

逆に、ネガティブにはたらくデータはどのようなデータかというか?

こちらもリスト形式で挙げると、以下のようになる。

  • 最高人民法院が認定した信用失墜被執行者リスト
  • 裁判所が関与した経済紛争の判決
  • 業務提携先からフィードバックされた違約情報

業務提携先からフィードバックされた違約情報というのは、たとえば、芝麻信用が提携しているシェアサイクルサービスにおいて、料金未払いや自転車の未返却といった不正行為が芝麻信用にフィードバックされ、信用スコアに反映されることをいう。

その他のデータ

これらの他にも、ポジティブ、ネガティブの双方にはたらきうるデータとして、以下のようなデータもスコアリングの際に利用されている。

  • クレジットカードローンの返済
  • ネットショッピング
  • 振込
  • 資産運用
  • 公共料金の納付状況
  • 住宅賃貸契約
  • 住所履歴
  • 社会的人間関係

「社会的人間関係」については、統計的な分析の結果、「資金のやり取りに基づく関係」のみが信用度に寄与するということでスコアリングに用いられている。

資金のやり取りがない、ただ単にSNSでつながっているという情報は信用スコアにおいて影響はないというわけだ。

各データの重要度は?

芝麻信用では、様々なデータと経済的な信用度の相関性を分析した結果、信用度に寄与するデータとして、5つの項目に分類をしている。

芝麻信用を構成する5つのデータ項目

芝麻信用のスコアリングの全体像
芝麻信用のスコアリングの全体像

経歴特性とは、公安局実名認証、学歴・学位、情報の安定性などのこと。

信用履歴とは、クレジットカードローンの返済履歴や借入返済記録、花唄・借唄(アントフィナンシャルの提供する借入サービス)の返済記録、公共料金の納付状況などのこと。

行動傾向とは、アカウントのアクティブ度、消費レベル、納付レベル、消費傾向のこと。

履行能力とは、決済口座残高、余額宝残高、所有書情報、不動産情報などのこと。

人間関係とは、人脈、友人関係の信用レベル、社会的影響力などのことをそれぞれ意味する。

5つのデータ項目の重み付け

これらのうち、書籍『アントフィナンシャル』によると、重要度としては、以下の順番で上から重要度が高いとしている。

  1. 信用履歴
  2. 行動傾向
  3. 履行能力
  4. 経歴の特性
  5. 人間関係

やはり、最もスコアリングに影響があるのは「信用履歴」であり、ここは納得だろう。

ただ、一方で芝麻信用の価値としては、このような信用履歴がないあるいは少ないユーザーに対しても、それ以外のデータを総合的に判断することで、その人の信用度をスコアリングし、融資のチャンスを与えているという点は忘れてはならない。

信用履歴がある場合には、もちろん信用履歴が重要なファクターとなるが、そうでない場合にこそその真価を発揮するものなのである。

データの質をいかに担保しているのか?

先述したとおり、芝麻信用では、数百ものデータパートナーからデータの提供を受けている。また、一部のデータ項目ではユーザーによる入力に頼る部分もある。

そうなると、間違ったデータあるいは故意に不正なデータを送ることで、スコアリングをハックしようと考える人も一定数いるだろう。

このようなデータ不備のリスクに対しても、きちんと対策をとっている。

データパートナー企業から提供を受けるデータについては、データの保有基準を定め、基準を満たすデータのみDBへ追加するようになっている。

また、個人申請のデータについては、公的ルートや既存の審査モデルを通じてクロスチェックを義務付けている。さらに、虚偽報告の場合には制裁が入りスコアリングが低下する仕組みとなっているため、これが悪行への抑止力につながっている。

さらに、ネガティブなデータについても、ユーザーはいつでもスマホで確認をすることができるため、これが一種の「監督システム」としてはたらいている

何らかの誤りがあればユーザー自身でクレームを送ることができ、そのクレームに対して、芝麻信用側では、20営業日以内に正確な回答を出すことを保証している。そして、もちろん間違えがあった場合には、元のデータは削除されるようになっている。

考察

本記事では、信用スコアの雄であるアントフィナンシャル「芝麻信用」の利用データ及びその重み付けについて解説してきた。

芝麻信用ほどの市民権を得ている信用スコアがどのように形作られているかをみると、非常に学びが多い。

日本でも、これからヤフーやメルペイ、ドコモなどの各社が信用スコアサービスのリリースを予定しているが、中長期的にどのように外部データを含め収集し、社会的に信頼されるスコアを作り上げていけるかは大きな争点となっていくだろう。

筆者が思うに、特に日本においては、個人融資のためだけの信用スコアではなく、生活シーンに応用されていく信用スコアになってこそ、その真価は発揮される

日本という市場をみると、消費者金融が広くサービス提供されており、お金を借りることができない層の割合はかつての中国に比べると圧倒的に少ないからだ。

また、外部データをいかに取り込んでいくという点については、2018年末より話題となっている「情報銀行」の仕組みの導入もヒントになるかもしれない。

いずれにせよ、ここ数年で大きな動きが目白押しとなりそうな信用スコアマーケットには、目が離せない。

関連記事

www.dappsway.com

芝麻信用の信用スコアの活用パターンについてはこちらの記事を。 www.dappsway.com

www.dappsway.com

参考書籍

芝麻信用についてはもちろん、その他のアントフィナンシャルの事業についても詳細かつ分かりやすく書かれている名著。フィンテックに関わる全ての人におすすめしたい一冊。

アントフィナンシャル――1匹のアリがつくる新金融エコシステム

アントフィナンシャル――1匹のアリがつくる新金融エコシステム