コラム  国際交流  2018.01.15

RegTech(レグテック)の大いなるポテンシャル: "Weapons of Math Destruction"の落とし穴を避けて

 先日、日経新聞が開催した RegTech Summit (RegSUM)に出席してきた。日経は今年、農業とITのアグリテック、Agritech Summit (AgSUM)と、金融とITのフィンテック、 Fintech Summit (FinSUM)に続き、今度はレギュレーション(規制)とIT周りRegTechに焦点を当てたサミットを開催した。

 レグテックというのは新しい分野で、定義がまだ定まっていない部分が多い(もちろん、定義が定まっているようで、実は様々な人が異なる意図で使っている言葉であるフィンテックなどの例もあるが、それは別の機会に述べられればと思う)。

 スタートアップなどの動向をデータで詳しく分析している CB Insightsは、レグテックを金融コンプライアンスにフォーカスした金融機関にとってのテクノロジーと定義づけているが、実はそれよりもかなり広い。

 今回のコラムでは、私なりに5つのレグテックの領域のカテゴリーをまとめた。どれも日本にとって大きな課題解決の可能性を秘めている。並べあげると下記の通りである。



1)政府の規制に対する企業のコンプライアンス

2)政府が企業を規制したり、情報を集めるためのツール

3)規制や法に照らし合わせると行動が違法だとする企業同士の紛争

4)政府ができないことをローコストで、あるいはやらないことを民間が代替してやる

5)政府に対して、政府がちゃんと自分の規制を守っているかチェック


 ちなみに、どのようなテクノロジーも、既存の企業や組織にとって「コストを下げる」というメリットと、今までできなかったことをできるようにする「より高い付加価値の追求」に分けられる。新しい技術を議論するときには、この二つのコンセプトを分けないと、その技術の真価が見えないことが多い。

 レグテックのカテゴリーをひとつずつ取りあげよう。



1)政府の規制に対する企業のコンプライアンス

 一つ目は、政府の規制に対して、企業がきちんと内部統制を取れたり、ハッキングに遭ったらタイムリーに政府に報告義務を果たしたり、様々なルールを守れるかどうかという領域である。特にファイナンス業界では、リーマンショック後に様々な規制ルールが設けられ、それに対して非常に大きなコンプライアンスのコストが、現在、金融機関にのしかかっている。罰金額もうなぎ上りになっている。このコストは、ソリューションを提供する企業にとってはビジネスチャンスであり、特にスタートアップがITを駆使して、スケールするようなローコストな体系で大企業のコンプライアンスに関わる業務を請け負うことによって、全てのアクターにとってメリットがある。金融機関は、コストを抑え上手にコンプライアンスに必要なデータを集めて分析することができ、効率良く政府に報告できる専門性が高い技術を駆使したスタートアップは、多くの大企業を取り込むことで自らのソリューションをレベルアップできる。

 同時に、社内の様々なデータを分析し、違法行為がないかどうかをモニタリングする領域もコンプライアンスの一環である。ここでは機械学習(俗にAIと呼ばれている領域)が非常に有効で、そういったサービスを提供している、大企業にはいない人材を駆使したスタートアップも目立つ。例えば、マネーロンダリングの発見は、絶妙に隠されたパターンを暴き出すことが必要なので、機械学習の得意分野である。

 そのようなソリューションを提供しているスタートアップには、スタンフォード発のAyasdiという会社があり、DARPA(インターネットの基礎技術を作ったことなどで知られる米国国防省の研究機関)の研究資金で Topological Data Analysisという手法の分析を使っている。

 これは、企業にとって非常にコストがかかるものの、コストカットを行う一方で、今までコストをかけても解析ができなかったマネーロンダリングなどの不正を発見できるという、言ってみれば付加価値も上げるという両方の側面がある。数々のスタートアップが、次々にこの分野に参入している。



2)政府が企業を規制したり、情報を集めるためのツール

 二つ目のレグテックの領域は、政府が企業をモニタリングしてコンプライアンスに従っているかどうかをチェックし、違法行為を発見するというものである。これは、上記の企業向けのコンプライアンスのツールや、サービスと組み合わせれば双方ともスムーズに情報を共有して活動ができるというポテンシャルがある。政府側も、モニタリングのコストを既存のルーティング作業を中心に大幅に削減できる。

 また、機械学習やパターン認識の技術を使って(俗に言うAI)不正や違法行為を探知できるシステムは、あらゆる分野で規制のモニタリングコストを低くするだけではなく、今までできなかったことを発見できるようにする。



3)規制や法に照らし合わせると行動が違法だとする企業同士の紛争

 企業同士が、規制や法に照らし合わせると行動が違法だという主張から生まれる企業同士の紛争は、既存の規制や法律に従ったルールの上で形成されている。そこで、あらゆるタイプの契約にまつわるトラブルや、知的財産を巡った争いを避けるためのレグテックもある。また、契約には弁護士やローファームが絡みコストもかかるので、法務周りの活動コストを下げる領域もある。

 例えば、あるスタートアップは契約のコストを下げるために、非常に簡単な契約テンプレートを提供している。これは法務コストを下げることに効果的である。

 別のスタートアップは、特許庁が公開している特許データを解析して、特定の案件が何らかの特許違反をしているかどうかを分析する。ここまではコストを下げるだけだが、それだけではない。このスタートアップは、中小企業が特許を出願しようと思った場合、それが認可されるかどうかの確率に加え、もし認可が下りそうでなければ、似たような領域で特許が出されていないところを見つけ出して提案してくれる。ちなみに、このスタートアップは、日本政府の特許庁が特許データを公開しているから成り立つのである。



4)政府ができないことをローコストで、あるいはやらないことを民間が代替して行ったり、政府のコストを下げる

 世界中の多くの政府は、様々な局面で政策を打ち出すための情報収集や分析のためのリソースが足りず、ITの力でコストを下げられるなら喜んで取り入れたい。あるいは、すでにITを使っていても、政府よりも民間企業のスタートアップの方が劇的に効率を上げることが可能なことも多々ある。例えば、アメリカの画像や動画の肖像権の登録を援助するスタートアップは、政府のウェブサイトだと使い勝手が悪いインターフェースを駆使して30分ほどかかるところを、そのスタートアップのサービスだと約6秒でできると自負している。これに対して政府は、このスタートアップを是非サポートしたいという姿勢でワシントンにも招集している。

 また、政府がやるべきであっても、政治的な理由でやらないこともレグテックの領域と言えるかもしれない。例えば、アメリカのトランプ政権では、環境保護省が様々な公害規制を撤廃し、省によるデータの採取も禁止した。これに反発した地方自治体や州は独自に環境データなどを集めるべく、民間企業のスタートアップと手を結び始めている。

 もちろん、政府内部の作業や、ルール作りにもレグテックの役割があるといえよう。



5)政府に対して、政府がちゃんと自分の規制を守っているかチェック

 政府が自らの法律や規制に沿って行動していないことがあり、これらを市民社会が監視するという行為にもレグテックは役立つ。例えば、あるスタートアップは、ニューヨークとロンドンで駐車違反切符のデータと詳細な地図データを照らし合わせた結果、短期間に930万ドル分の37万件もの駐車違反切符が不正に切られていたことを発見し、これらの違反金を還元することができた。



実験段階:政府が自らの意志決定にアルゴリズムを使用

Algorithmic Regulation

 まだもう少し未来の段階だが、シリコンバレーのITメディアを運営するTim O'Reillyは、"Algorithmic Regulation"という概念を提唱している。それは、規制がどれくらいの質で機能しているかデータを自ら集め、必要があれば規制自体を修正して、自動的にパフォーマンスを上げていくという構想である。政策や政府の透明性を向上させるという意味で、この考え方は大変魅力的である。しかし、もちろん実世界では、アルゴリズムを上手に適用しないと、思わぬ副作用に見舞われる可能性がある。


"Weapons of Math Destruction"

 アルゴリズムやAIによって様々なもの、そして人の活動が測れるようになると、気をつけなくてはいけないのは、 Weapons of Mass Destruction (大量破壊兵器)ではなくWeapons of Math Destruction (数学破壊兵器)という、ちょっとユーモラスな名前の非常に深刻な事態である。*

 アルゴリズムによって行われる評価は具体的にどういう手法で評価を行っており、どういうパラメーターを使っているかが理解されていないと、非常に深刻なバイアスがかかってしまう危険性がある。

 例えば、ワシントンDCの公立学校では、教師の雇用を続行するか解雇するかという判断の6割をアルゴリズムのスコアで決めることにした。しかし、そのアルゴリズムの内容は公開されておらず、基本的にはある学年に入ってくる生徒の前年の試験の点数を学年の最後でもう一度測り、伸び率を測定するものだった。誰もが良い教師だと思う人の評価がアルゴリズムによる評価では低いということになった途端、その教師は解雇された。しかし、実情は、教師の雇用に関わる重大な学年末テストなので、前の学年の教師が生徒のテスト答案を改ざんしていた疑いが強かった。つまり、実力以上の試験点数で学年に入ってきた生徒たちは、その学年の最後に改ざんなしのテストを受けたら伸び率が低いという結果になってしまったのである。しかし、「アルゴリズムは客観的で、しかも絶対である」という姿勢により、教師の解雇はそのまま実行され、根拠も示されないまま再評価の機会も無く、あっさりクビになったのである。(その教師は誰もが認める優れた教師だったので、私立の学校がすぐに雇った。)

 また、犯罪摘発でも、摘発率を上げようとするアルゴリズムによって警察のパトロール地域をオプティマイズさせたところ、低所得のエリアを重点的にパトロールするようになった地域がある。しかし、これは社会の分断を深刻にさせるものである。というのは、確率論で言えば、低所得エリアをパトロールした方が、道端でアルコールを飲んでいる(アメリカでは違法である)人を発見したり、適当に車を止めれば、無免許運転や保険料の支払いが滞っている人に会う確率が高い。それらの人を摘発すれば、確かに摘発率は効率よく上がる。しかし、低所得ではない郊外でも犯罪は発生するのに、低所得エリアを重点的にパトロールすることで、統計上低所得エリアの犯罪率が上がるという結果になり、より重点的にパトロールされることでさらに摘発率を上げ、結局犯罪者の数を増やすことになる。そして、逮捕歴がある人は職を得るのが困難になり、より深刻な犯罪に走らないと生計が立てられない。負のスパイラルが加速してしまうのである。したがって、一見「犯罪摘発率を向上させる」という社会的に意義がありそうな目的でアルゴリズムによるオプティマイゼーションを追求したが、その副作用で社会の分断が深刻化してしまった。

 レグテックがこれから飛躍的に色々な場面で役立つのは一目瞭然だが、Weapons of "Math" destructionを避けながら上手に活用していきたい。


*O'Neil, Cathy. Weapons of math destruction: How big data increases inequality and threatens democracy. Broadway Books, 2017.