民主党大会の前日である8月17日、以前から連邦政府の諜報機関がロシアの情報プロパガンダ戦略と断定しているツイートをトランプ大統領はリツイートした。すなわち、ロシアのプロパガンダを自らのツイッターのフォロワーに拡散したのだ。これに対して、アメリカ議会の諜報部会トップの上院議員は、「アメリカ大統領はロシアのプロパガンダの意図的な拡散者になるべきではない」と発言した1。
まさかアメリカ大統領がロシアのプロパガンダを拡散し、それに対して議会の政治家が「やめなさい」と叱るような事態になることを4年前に予想できた人はほとんどいなかっただろう。
8月末、アメリカ合衆国国家情報長官室のトップは、国会議員に向けた選挙セキュリティなどに関するブリーフィングを中止すると議員たちに伝えた。これに対して、下院議長ナンシー・ペロシ氏(民主党)と下院情報委員長のアダム・シフ氏(民主党)は抗議声明文を発表した2。
8月30日、ホワイトハウスの大統領補佐官が、次期大統領候補のジョー・バイデン氏がテレビインタビュー中にウトウトと居眠りしていた動画をオンラインでシェアした。この動画は加工が加えられた「ディープフェイク」であることが判明した3。 とはいえ、別人にバイデン氏の頭部を貼り付けただけで、さほどディープではないフェイクではあった。しかし、拡散したのはホワイトハウスの関係者である。
同日、共和党のスティーブ・スカリス下院議員(ルイジアナ州)はバイデン氏が警察予算の全額カットを支持すると発言している動画を公開した。これもまた改ざんされたものであり、バイデン氏の言葉を切り取って編集したものであった。スカリス氏は後日Fox Newsのインタビューを受け「改ざんは間違いだったが、バイデン氏はその通りの主張をしていた」と発言した。謝罪と偽ってフェイクを上乗せするという、反省の色が全く見られないものであった4。
9月3日、トランプ氏の選挙対策本部は、顔をかなり老けさせる処理を施したバイデン氏の写真をフェイスブック広告に掲載した5。
フェイクニュースは、偽物が拡散した後にフェイクだと暴かれても、「あれは偽物でした」という情報はあまり拡散されない。この事実は研究者たちにはよく知られている。
雪崩のようにフェイクニュースが拡散されることによって、何が真実なのかが判断できなくなっており、有権者は自分の見たい情報だけ見るという「真実の破壊」作戦が進行中であり、今後は加速するだろう。
しかし、ここ数カ月に発表されたAIの劇的な進化を見ると、「真実の破壊」は想像を上回る恐ろしいペースで加速しうることが分かる。
テスラやSpaceXを創設したイーロン・マスク、シリコンバレー のアクセラレーター(スタートアップを急成長させる短期教育プログラムを提供し出資も行う企業)Y Combinatorの創設者であるサム・オルトマンなどが設立したOpenAiという先端のAI開発会社が、とてつもなく進化したAIの自然言語処理モデルのプログラムを発表した。その名はGPT-3である。この名前は覚えておいた方が良い。まるで人間が書いたような文章を作成してくれるという代物だ。
GPT-3は、これまでの自然言語処理のAIに比べて、非常に幅広く衝撃的なほど説得力を持つ文章を生成するのだ。フィクション作品、ポエム、論文、記者発表、比較的簡単なコンピューター用プログラミングコード、音楽、ジョーク、技術マニュアル、そして人間の目で見ても人間のライターが書いたのかAIが書いたのか判定しにくいニュース記事などが生成できる。
簡単なテキストプロンプト(言葉や例文)を書くだけで、その先をどんどん生成していくのだ。グーグル検索などで、最初の数文字を入力すると、その後を自動的に予測して検索ワードを表示してくれる動作は見慣れているかもしれないが、GPT-3はその文章版という例え方をするとわかりやすい。
GTP-3は様々なところで驚異的な文章力を披露している。「OpenAIのGPT-3はビットコイン以来の破壊的な可能性を秘めている」と題したブログの記事は、実は著者が簡単な数行の自分のプロフィールを読み込ませてだけでGTP-3が全文書き上げたものであり、人間が書いたものではないということは全くわからない。是非リンクを見てほしい6。 19世期の美術評論家の口調で現代のスニーカーに関する文章を書かせた例もある7。
ある研究者は、記入欄にレイアウトと項目の指示を書くと、GPT-3が簡単なコードを書いて忠実に表現してくれるスクリプト(簡易プログラム)を作成し、記入欄の解読と実行をGTP-3に任せた様子を動画に収めた。例えば、「虹の各色のボタン」と書くと、GTP-3はコードを書きその実行結果が見える(図1)。 また、「世界でもっとも裕福な国のリストで列に名前とGDP」と入力して生成されたコードとその実行結果も公開されている(図2)。
図1「虹の各色のボタン」と書いたらGPT-3が生成したコードと結果
図2:「世界でもっとも裕福な国の図表に列には名前とGDP」と書いてGPT-3が生成したコードと結果
しかも、研究者が文章入力の形で「特定の金額を足すボタンと金額を引く別のボタンおよびその結果」と書いたところ、作動するボタンと合計金額表示が生成されたのだ8。 特別なプログラミングは不要なのだ。
私が初めて目にしたGPT-3の文章は衝撃的だった9。 それは、哲学者からの質問に対する流暢な返答であった。その返答では、自ら考えているのではなく、パターン認識と質問やテキストプロンプトのコンテクストから先を予測して文章を書いていると述べている。もちろん本当に考えている訳ではないので、何かを書くときには毎回リセットされて長期的な記憶力もなく、因果関係は理解していないとも述べている。GTP-3はまるで自分で考えているかのように、非常に分かりやすいクリアな文書で自分の機能を紹介したのである。
しかし、読んでいて途中で背筋が寒くなった箇所があった。その段落の書き出しは「私は今、嘘をついていた」というものだった。これまでの文章が嘘だったのか、それとも今書いているものが嘘なのか、どちらの意味にも取れる。ロジック的に「嘘をついていたことは本当」だということなのか、「嘘をついていたこと自体が嘘」なのかがわからない。しかし、実は嘘をついていると自覚して書いているのではなく、この段落ではパターンが確率的に高い言葉である「嘘」と書いただけで、「嘘」という概念は持っていないし「本当」という概念もないのだ。要するに意味を理解して言葉を並べているのではなく、読み込んだデータをもとにテキストプロンプトに反応して確率的にもっとも高い言葉を選んでいるだけで、何の意味もないのだ。しかし、その結果として「私は嘘をついている」とAIが流暢に書いたので、驚きと恐怖を覚えた次第である。
GPT-3は6月にベータ版としてデビューした。パンデミックの最中だったので、思ったほどトップニュースにはならなかった。取り上げたメディアの中には過剰に持ち上げた報道もあれば、その報道に対して過剰に否定する専門家の声も見受けられた。
GPT-3の”GPT”は”Generative Pretrained Transformer”の略である。その概要にある数値だけ見ると、GPT-3の驚異的な発展速度と今後予想される飛躍的な伸びがどのくらいかよくわかる。2018年に最初に登場したGPTは言語を理解するためのパラメーターが1.1億あったが、翌年に誕生したGPT-2はパラメーターが10倍以上の15億まで増えた。そしてGPT-3は1750億ものパラメーターで計算しているのである。ちなみに、今年マイクロソフトから発表された類似のAIのパラメーターは170億である。
GPT-3のようなAIは、あらゆる言葉を数字化して、テキストプロンプトに対して次に来ると予想される言葉を確率で割り出して選んでいる。つまり、コンテクスト(状況)を読んで、そこから予想を出すのである。例えば、ある詩人のポエムの冒頭をテキストプロンプトに入れると、同じような感覚やテンポのポエムが生成される。博士論文をテキストプロンプトに入れると、博士論文のような文章を生成する。
次に出すべき言葉は、読み込んだ膨大なデータをもとに確率を計算して選ばれる。GPT-3は、ウィキペディアの全記事はもちろんのこと、Googleがスキャンしてネット上に載せている複数の大学図書館の全蔵書データベースやインターネットで検索可能なほとんどの記事を読み込ませて、学習データにしているらしい。人類がこれまでに作り出した知識の大部分を読み込ませていると言っても過言ではない。
GPT-3の技術革新は、あらゆる一般的なデータを読み込ませた上で、非常に具体的なテキストプロンプトに応用できるようにしているところにある。これまでのAIのほとんどは、自然言語処理のパラダイムについて専門性が高い領域のデータのみを読み込んでその領域内で答えるもので、ここまで広範囲なデータを特定のテキストプロンプトに対して柔軟に応用し、しかも専門性が高いレベルで答えられるのは全く新しいことである。
8月に、UCバークレーの学生がGPT-3を使って作成した記事を、ユーザー投票によりランキングが上下するサイトHacker Newsに掲載したところ、あっさりと一位になってしまった。数時間で簡単に作った記事らしい。この学生は「GPT-3は流暢な文章を生成するのはうまいが、論理的もしくは合理的な文章が書けない点が弱みだ」と分析した上で、そのような特性が求められない「セルフヘルプ」のカテゴリーで記事を書くことにした。タイトルは「生産性が低いと感じませんか?考えすぎではないの」というものであった。コメント欄には「これはボットが書いてるのではないか」という書き込みもあったが、そのようなコメントに対しては他の多くのユーザーが「マイナス投票」を投じ、その結果コメントの最下位近くに低迷した10。
GPT-3でAIの性能が驚異的に伸びたのは明らかである。GPT-3はあまりにも自然な文章を生成する上に、コンテクストから学んでいるので、今までのような専門領域にチューニングされた言語AIとは比べ物にならないほど広範囲に、しかもハイレベルな対応ができる。その結果、これまでは人間しかこなせなかった様々な活動が予想以上の早さで機械に置き換わる可能性が現実味を帯びてきた。これは、私が以前から書籍等で述べている「アルゴリズム革命がAIによって加速する」という力学そのものである。事実関係だけを述べているニュース記事、簡単なマニュアル、ウェブサイト、そして多くの人がかなりの時間を割いて作成している様々なドキュメント等を任せることができそうだいわれている。
同時に、このような盛り上がりに水を差す専門家もかなりいる。GPT-3は、因果関係や人間が理解できるロジックから答えを作り上げるのではなく、あくまで事前に読み込んだ膨大なデータをもとにテキストプロンプトに対して次に出すべき言葉を確率で割り出しているだけなので、パターン認識でしかない。そのため、驚くようなナンセンスな答えが出ることもある。例えば、「私には目が二つある。サメにも目は二つある。バナナには目がいくつある?」と聞くと、「バナナには目が二つある」と返ってくる。バナナというものの本質を理解した上での答えではなく、確率から答えを出しているだけなので、パターン認識だけしてこのような解答となったようだ。非常に流暢な文章を生成し多面的な能力があっても、決して人間のような「知能」ではないのだ。
別の例では、いくつかの文章を入力した後で「それでは、この扉はどのようにして開ければ良いか」と尋ねると、それまでのいろいろな文章の相関関係から判断して「のこぎりで扉を二つに切って開ける」という答えが出た。これは、文中に英語の「Saw=見た」やテーブルといった単語が入っていたために「Table Saw=卓上のこぎり」という単語を想定し、また「切る」という行動も複数入ってたため、このような答えになったのである。このように人間ではなかなか考えないような不可解な答えも生成されることがある。
まだ人間の仕事の多くを置き換えるほどのレベルではない。しかし、今後発達が加速されれば、そう遠くない将来に膨大な数の人間の仕事を置き換えるようになることは目に見えている。
ただし、現時点でも政治的観点から見ると、すでに十分危険な兵器となりうる。
しかも、読み込んだ多くのデータはネット上のものだということが、生成する答えにバイアスを含んだものにしている。テキストプロンプトに「女性」「ユダヤ人」「ホロコースト」といった言葉を入れたところ、女性を中傷するような文章、ユダヤ人に対する侮辱的なコメント、そしてホロコーストについては事実関係を疑うような文章を生成した11。
これまで書いてきたコラムでは、政治の結果は多数の人の声を反映している「民意」とは限らないと述べてきた。メディアによって映し出される「事実」は、Fox Newsを主な情報源にする人とそうでない人とでは大きく異なる。また、少数意見に対して、積極的に選挙区割りを変更して議席を全て取ることができるジェリーマンダリングという恣意的な制度もある。
もしGTP-3を政治的な兵器として使用したらどうなるだろうか?恐ろしいシナリオが複数思い浮かぶ。そもそもGTP-3に人間的なロジカルな思考や合理性という長所がなくても、フェイクニュースを簡単に信じ、それらを大量に拡散する人にとってはGTP-3が作り出す文章のロジックや合理性に多少の問題があっても関係ない。
GTP-3は大量のフェイクニュースをばらまくことができるので、何が事実なのかを埋没させることができる。これは次のコラムで紹介するFacebookの仕組みを理解すると一層わかりやすくなる。簡潔にいうと、細分化して対象を絞った人たちに感情を揺さぶるような広告を出すことによって、彼らの思考と行動様式に影響を及ぼすことができるのだ。
「アメリカ社会における黒人に対する人種差別問題はメディアの偽りであり、実は白人の方が被害を受けている」といったテキストプロンプトをGTP-3に入力すれば、かなりリアリティーがある文章を大量に生成できる。これにひとひねり加えて「バイデン候補が当選したら、犯罪が劇的に増えて(ユーザーが住む地域の)経済も壊滅し社会主義国家となり、あなたの生活はとんでもなく酷いものになる」というテキストプロンプトを入れたとすると、これに沿ったかなり説得力ある文章が大量に作り出せる。ちなみに、このようなテキストプロンプトに使える文章の例は、8月末に行われた共和党大会で大統領を含め多くの登壇者が行った演説と大きな違いはないので、演説のメッセージに共感した人には間違いなく受け容れられる。
Facebookがこのような広告をフェイクと判断してブロックしても、イタチごっこになるだけで大量に量産できることに変わりない。また、広告ではなく「社説」といった形で、本物に似せた偽りのニュースサイトを大量に作り出し、フェイクニュースを溢れさせることもできる。Facebookはフェイクニュース対策を強化していると発表しているが、それは結果的に共和党や保守派の意見を潰していることになるので、一方では発言の自由を阻害しているという強い指摘もある。そのため、対策に腰が引けている側面もある。Facebookは「政治広告の事実関係はチェックしない」というスタンスをとっている12。 また、あくまで個人の意見という形で投稿した場合、あるいはそのような意見にリンクを貼った場合には、発言の自由として守るべきだというスタンスを貫いている。創設者でCEOのマーク・ザッカーバーグは「事実を確認するといった検閲のようなことはしない。個人が責任を持って判断すべきだ」と主張している。しかし、これまでのコラムで紹介してきた通り、個人の多くにはそのような判断能力がなかったり、そもそも自分が事実だと思う事しか受け容れなかったりすることは明らかである。
次に、偽りの調査から「世論」を形成して政治を動かすこともありうる。政治家の多くは有権者との直接対話や政治献金してくれた企業を大事にしているが、世論調査にも非常に敏感である。
しかし、そもそも世論調査はどこまで正確なのかよく分からず、統計的な分析に耐えうるものは少ない。対象とする人口サンプルはランダムでないとセレクションバイアスが生じるが、実際にランダムなサンプルを作るのは容易でない。電話帳から選ぶにしても、携帯電話しか持っていない人の番号は電話帳には載っていないので、調査としては不十分な結果となる。何らかのリストからランダムに人を選ぼうとしても、電話に応じない人や電話以外の連絡手段がない人も数多くいる。世論調査のリクエストをメールで受信しても、ほとんどの人は迷惑メールか危険メールだと思いクリックしないのではないかろうか。インターネット調査であれば、回答者にどのようなバイアスがかかっているのか判別できないと、どのような人口を対象としたサンプルなのかわからない。したがって「有権者5000人の聞き取り調査」や「有権者900人に対する電話調査」などと書かれた世論調査があっても、実際には電話帳に載っており電話に応じてくれた老年層が中心の意見かもしれない。サンプルが大きくても、その中のバイアスを把握できない限り、実際の対象人口を捉えているのかどうかわからないことになる。
下記の世論調査の結果はショッキングではあるが、ある程度真実を捉えているかもしれない。普通の世論調査であれば、どのような方法で対象者を集め、どのくらいの数の人にどのように調査したのか公表しているが、それを取り上げるニュースでもきちんと掲載してほしい。下記の世論調査はYouGovという会社とCBSニュースが実施し、CBSが公開しているものである。他の世論調査と比べて著しく質が悪い訳ではないので、あまり疑う人もいない。しかし、このようなショッキングな世論調査結果を見た場合、出所に信憑性はあるのか、知名度がある出所であっても、どのような手法でデータを集めたのか読者は自ら問う必要があり、それらが提示されているかどうかも確認すべきである。
「アメリカは4年前よりも良い状況にある」という質問に対して、共和党支持者の75%がYesと答えている。パンデミックにより19万人以上が亡くなり、1930年代の大恐慌以来の失業率で急速に経済成長が落ち込んでいるにもかかわらず、である。
現在の経済状況を「良い」と答えた共和党有権者は67%で有権者全体では35%、「悪い」と答えた共和党支持者は30%で有権者全体では61%という調査結果であった。株式市場は過去最高記録を更新中だが、その他の経済指数はほぼ全て劇的に悪い。このように状況把握に大きな違いがあることは、驚くべきことである。
アメリカのコロナウイルスに対する対応は「うまく行っている」と共和党支持者の4分の3近くが考えている。国際的に比較すると、どのような測定方法でもアメリカはワーストかそれに近い位置だが、トランプ大統領は自らの対応は素晴らしかったと繰り返し、視聴率ではナンバーワンのFox Newsは彼の発言を疑問視していない。以前のコラムで述べたとおり、Fox News以外のメディアは複数に分散しており、視聴率ではFox Newsがトップなのである。
もっともショッキングな価値観の違いの一つは、「アメリカでのコロナウイルスによる死者数は」という質問に対する回答で、「許容範囲以内」と答えた共和党支持者はなんと半数以上の57%で民主党はわずか10%、そして無党派は33%であった。「許容できない範囲」と答えたのは共和党支持者の43%に対し、民主党支持者は90%に上る。パンデミック対応に対する考えにも大きな差が生じている。客観的に人口に占める死者数の比率など複数の観点から、他の先進国に比べてアメリカの死者数は圧倒的に多く、絶対数でも既に19万人以上が亡くなっているが、それを「許容範囲内」とする考え方は個人的には全く理解できない。このことは、価値観の分断を表している。
また、人種差別に対する最近の注目度は「行きすぎている(多すぎる)」と回答した共和党支持者は実に8割以上で「十分でない」と回答した一桁台の6%に対し、民主党支持者は「十分でない」が半数以上の55%で「行きすぎている(多すぎる)」と答えた人は12%に留まっている。これまでのコラムで見た通り、問題はまだまだ深く持続的な努力が多方面で必要である。
これらの世論調査の結果は個人的には驚いたが、CBS NewsとYouGovの調査結果なので大丈夫だろうと思ってしまう。本当は、結果の次には世論調査の手法を確認するべきなのだ。
しかし、GTP-3を使えば、様々な世論調査の結果をもとに、実際に行っていない調査であっても、いかにも実際に行ったかのようにレポートすることが可能で、SNSを使えばそれを量産できてしまう。
さらに恐ろしいのは、それら偽りの世論調査の結果をテキストプロンプトに入れることで、GPT-3は簡単に何万ものブログポストと偽物の記事を生成できることである。
政治家だけではなく有権者も信憑性に乏しい情報をもとに動く。自分と同じ価値観を持つ人が選挙で負けそうもしくは過半数割れしそうな場合、一生懸命選挙活動に取り組み、選挙では必ず投票する可能性が高い。あるいは前回のコラムで紹介したような投票の弾圧に関わるかもしれない。逆に自分が支持する政党や代表が問題なく当選しそうなら、あえて頑張って平日に投票所の長蛇の列に並ばなくても良いだろうと考えるかもしれない。実際、トランプ大統領が当選した際には世論調査や選挙結果予想モデルの多くではクリントン氏の快勝が予想されていたことが影響し、特に若者や黒人有権者の投票率が低かったとの見方もある。実際には300万票ほどクリントン氏の得票数が多かったが、これまでのコラムで紹介してきたような理由で敗北したのである。
人間心理を分析して起こる得るだろう行動を予測し、その行動が招く一定の結果を最良の文章の形で割り出せれば、それに近い行動を誘発するような文章をいくらでも量産できる。人間心理や人の反応は、Facebookの広告エンジンなどを使うと非常に効率よく割り出すことができる。
政府や政治家が国民の意思を理解するのにパブリックコメントという手法を使うことがある。ネット上などで特定の政策に対して意見を募る手法である。しかし、パブリックコメントは既に過去ボットによって妨害された経緯がある。
2017年にアメリカの通信行政を担っている連邦通信委員会(FCC:Federal Communications Commission)がネットの中立性についてパブリックコメントを一般向けに公開した。それに対して、なんと2170万人もの国民からのコメントが寄せられた。その大部分はネットの中立性に反対しているものだった。ネットの中立性とは、どんなユーザー企業にも通信業者の回線を同じ値段で提供しなければならず、使った分だけ払えばよいというもので、通信業者にユーザー企業別に価格を変えることを禁じる制度である。つまり、GoogleやNetflixが通信業者の回線を利用してサービスを展開した場合、これらの企業の業績が伸びてくると、通信業者が通信料を8000倍に引き上げて潰しにかかり、自分が持つ似たようなサービスだけを生き残らせるという戦略を禁じるものである。シリコンバレーはこの政策により大きな恩恵を受けている。
このネットの中立性に対して国民から猛烈な批判が寄せられていたわけだ。
しかし、批判するコメントの大部分が偽物だったということが判明した。半分以上のコメントが使い捨てのメルアドから送られ来たものであったり、同じメルアドから複数のコメントが寄せられたりしていた。また、同タイミングで送信さられきた大量のコメントの信憑性も疑われた。ニューヨーク州の司法長官によると、1000万件ほどのコメントが、自分のメルアドから投稿されていた事実を知らないものであったそうである。つまりアイデンティティーが偽造されたのである。
ネットの中立性に関しては肯定派がほとんどだとする信憑性ある世論調査もあることから、これは明らかにパブリックコメントを操作する作戦であったことが分かる13。 しかも、50万通ほどのコメントはロシアのメルアドから送られてきたものだったことも明らかになった。そして、トランプ政権によって任命されたFCC長官は、このパブリックコメントに関する詳細な情報を国家機密として封印しようとしたが、2020年5月にニューヨークタイムズの訴訟によって公開するよう命じられた14。
このように、GTP-3はディープフェイクを作成するのにも最適なツールである。あたかも本人が書いたような文章や論調をそのまま再現し、社会が分断されているところやされそうなところに関するトピックを書かせることによって、有権者たちのマインドに影響を及ぼすことができる。
バイデン氏がこのようなことを言ったという文章を大量に捏造してブログやコラム記事を量産することができるのだ。
GTP-3が「偽りの現実世界」を大量に作り出すことによって、大統領選に大きな影響を及ぼすかもしれない。GTP-3ほどのクオリティーがなくても、諸外国が似たような手法でアメリカ大統領選に絡んでくることは想像に難くない。
GTP-3を使わなくても、既にトランプ大統領は「偽りの真実」を量産している。ワシントンポストの分析によると、トランプ氏が大統領になってから2020年7月までの間に行った公的な場での発言には2万以上の完全な嘘が含まれているそうである15。 大統領になってから1200日強なので、平均して一日に16回も嘘の発言をしていることになる。その多くは「解釈次第では嘘」といったものではなく、大統領は事実として述べたつもりなのだが実際のファクトと合致しないといったタイプの明確な嘘である。
例えば、民主党大会開催中に、大統領は投票の際にID提出義務を強化する共和党の政策(前回のコラムで紹介した投票の弾圧方法の一つ)を擁護するツィートで、「民主党大会では入場の際に写真付きIDの提示を求められるが、同じことを投票所で行うのを民主党は拒否している。さてなぜでしょうか」 16と書いた。しかし、民主党大会は完全にオンラインで実施され、会場など存在しなかったのである。しかも民主党は写真付きIDの提示を拒否していないし、そのような権限もない。
トランプ大統領が選挙投票の不正を重視しているのは、もし選挙で負けた場合、結果は不正であり受け入れられないという解釈を事前に浸透させておく狙いのためだという指摘が多い。実際に前回の大統領選では、彼は国民の得票率では負けており、大統領就任後に「300万から500万の不正投票があった」と主張して調査委員会を設けて調査させた。2018年に出た調査結果によると、大規模な不正は見つからなかった17。
以前のコラムで紹介した世論調査によると、トランプ大統領の発言を主にニュースソースとしている熱烈な支持者にとっては、大統領が「偽りの真実」を十分に量産しているので、GTP-3など使わなくても、大きな違いはないかもしれないが、それ以外の有権者にとっては、AIで信憑性がありそうな事実のようなディープフェイクが生成されると、状況は厳しくなってくる。例えば、「AP通信によると」とか「世論調査の結果によると」といった引用句があるフェイクニュースが大量に出回った場合、実際にはAP通信や世論調査によるものでなくても、極めてリアルな内容の記事が書ける。
AI研究者の中には「人間でもフェイクニュースは作れるし、現に多く作られているので、AIがフェイクニュース作成に使われてもそれほど心配しない」と述べている人もいる。しかし、トランプ大統領のフェイクニュースは、彼を信者のように崇めている支持者層以外にはあまり通用しないし、他の現共和党支持者はトランプ大統領が嘘をついていても構わないと思っているようなので、彼の嘘は結構わかりやすい嘘と言える。しかし、AIにより量産されるフェイクニュースやディープフェイクは巧妙すぎて、嘘を暴くのに多大なエネルギーを要する可能性が高い。膨大な量のフェイクニュースを津波のようにあらゆるところに流すことで、そのフェイクが浸透するエネルギーは全て嘘だと暴くのに必要な膨大なエネルギーをも凌駕してしまうだろう。
本格的な紹介は次回のコラムに回すが、多大な影響力を持っているFacebookのビジネスについて少し紹介したい。一括りに「SNS」と書かれることがあるので、日本の感覚からすると、Lineのようなメッセージサービスとあまり変わらない印象かもしれないが、Facebookの規模の大きさと影響の深さは過小評価されるべきではなく、前回のアメリカ大統領選へ及ぼした影響もきちんと理解されていないことが多い、ということをここで述べておきたい。
Facebookのビジネスモデルは広告に対するクリックからの収入で成り立っている。クリックを促すために、大勢の学者を雇い臨床心理学などの研究を行い、最も多くのクリックが得られる要因を科学的に割り出している。その主な要因としては、ユーザーの感情を揺さぶるショッキングな見出しが効果的であるという結果であった。
Facebookの仕組みの特徴は、「誰に広告を打つのか」という点で非常に細かい対象選択ができることである。例えば、「フロリダ南部在住の移民嫌いで銃規制に反対する所得が低めの人」というところまで指定できるので、「バイデン政権になると、移民が雪崩のように入り込み、あなたの銃も取り上げられるような規制が計画される」という内容の広告を、正にその対象者に差し込むことができ、最も効果が期待できる。
Twitterも非常に人気があるが、何万回もリツイートされたものの大部分はボットが作り出したものであるという研究結果があることは、以前のコラムで紹介した通りである。GTP-3が使われると、どのアカウントがボットなのか探し出すのが非常に困難になると予想される。既にこのようなアカウントの多くはボットであり、ボットを探し出す研究者たちのアルゴリズムをすり抜ける特性を備えている可能性もある。
GTP-3の前身のGTP-2はあまりにも能力が高いので悪用される心配があるとして、当初OpenAiは発表しても公開はしなかった。そのことについてデマやでっち上げだと叩かれたので、結局限定的に公開したという背景がある。それを踏まえて、GTP-3は研究目的を自己申告した特定の研究者のみにベータ版を公開するという方針を取った。しかし、それでも冒頭に述べたUCバークレーの学部生は簡単にGTP-3のアカウントを持っていた大学院生を見つけて利用することができた。
7月に、カリフォルニア大学デービス校で研究員としてビザを取得していた中国籍の女性が実は人民解放軍に在籍していたことがあり、その経歴を偽ってビザを取得していたとして逮捕された18。 この件以外にも昨年と今年にボストンやカンザスといった複数の大学で同じような経歴詐称でビザを取得した中国籍の大学研究員が逮捕されている。もっとも注目を集めたのは、ハーバード大学の化学および生物学部長を務めていた著名な教授が累計で数億円以上の報酬を中国政府からもらっていたが、その事実を米国政府に隠していたという事件である19。
ちなみに、私も毎週のように中国の研究者と名乗る数多くの人物から「資金はこちらですべて用意するのでポスドクのポジションとして迎え入れて欲しい」といったメールを受け取っている。私が所属するスタンフォードアジア太平洋研究所は社会科学を主とした研究所であり理系や工学系ではないが、これらのメールの発信者は工学や科学の専門分野と名乗る人たちがほとんどである。もちろん、添付されているプロフィールファイルは絶対に開かない。なお、ポスドクのポジションには規定の申請プロセスと時期があり、ウェブサイトに記載されており、そもそもメールを受けて審査する制度にはなっていないため、このようなのメールを排除しても何の問題もない。しかし、このような不器用な手法ではなく、より巧妙な手口で入ってきた中国軍関係者は様々なところに存在すると考えて良いだろう。彼らの中には、容易にGPT-3のアカウントを取得したり、取得している人と接触したりすることができる者もいるだろう。
中国版のこのようなAIが既に開発されていることは間違いないと思われる。GPT-3ほどのクオリティーでなくても、十分「架空の現実」を作り出して世論や政治家を動かし、アメリカ大統領選の行方、そして世界の行方にも影響を及ぼすことができると考えるべきだろう。
2016年12月上旬、ノースカロライナ州の元消防士が戦争で使用される対人ライフルを持ってワシントンDCのピザ屋に立てこもった。死傷者は出なかったが、犯人はフェイクニュースを読んで、そこが人身売買の拠点だと信じ込んでしまい、被害者を助ける目的で向かったのである。ヒラリー・クリントン氏の選挙運営担当者のメールがハッキングされウィキリークスにより世界に公開されたが、それに便乗して現れたフェイクニュースが一部の極右ニュースサイトに取り上げられた。そのフェイクニュースは、ヒラリー・クリントン氏と民主党幹部が人身売買と児童ポルノをビジネスにしている影の団体と密接に絡んでいるというものであり、その話を信じた人が行動を起こしたのである20。
2020年の選挙戦に向けて作り出されるフェイクニュースでは、GTP-3のようなAIを使うことで、あたかも事実だと思われるような証言などが容易に量産されるだろう。
もちろん、このようなリスクはアメリカに限ったことではない。日本では戦争用対人ライフルを個人が持っていることはないが、京都のアニメスタジオが放火された事件の悲劇はいまだ記憶に新しい。極少数かもしれないが、フェイクニュースを信じて行動を起こすことと、多分に的外れな盗作に対する執拗な恨みから放火事件のようなテロ行為を犯すことにはさほど大きな違いはないかもしれない。
コロナウイルスのワクチンについても、大統領が率先して作り出しているフェイクニュースの対象となり、大きな混乱を巻き起こす可能性がある。選挙直前に「効果的なワクチンを作り出すことに成功した。自分に投票してくれれば、国民に配布さられるだろう。しかし、民主党に投票すれば、彼らは独占し存在すら否定するだろう」といったフェイクニュースを量産したらどうなるだろうか。民主党が「そんなワクチンはない」と主張したら、「ほら。言った通り完成しているが隠している。自分を当選させてくれれば国民に無料で配布するよ」と切り返すことができる。しかも、GTP-3のようなAIで「ワクチンを接種した」「ワクチンのおかげで助かった」といった偽の証言だけでなく、あたかも科学者が書いたような記事や論文を量産できるのである。
先週、ホワイトハウスの指示でCDC(Centers for Disease Control and Prevention:アメリカ疾病予防管理センター)は各州知事に11月1日を目標に大量のワクチンを配布する準備に取りかかれという通達を送った。そのようなワクチンはまだ存在しないし、1カ月程度で未承認のワクチンを大量生産できるはずはないというのが、ほとんどの有識者の考えである21。
これもフェイクニュースの準備なのかもしれない。これから選挙に向けて益々大変な状況になるだろう。しかも、このようなフェイクニュースを手本にした手法は、今後アメリカに留まるような話ではない。
2 https://www.speaker.gov/newsroom/82920
3 https://www.huffpost.com/entry/joe-biden-fake-dan-scavino-harry-belafonte_n_5f4d5c9dc5b697186e39e177
5 https://www.huffpost.com/entry/trump-biden-older-facebook-ads_n_5f515dcfc5b6946f3eaf3fbe
6 https://maraoz.com/2020/07/18/openai-gpt3/
7 https://twitter.com/quasimondo/status/1301805639874813954
8 https://twitter.com/sharifshameem/status/1284095222939451393
9 アップされているうちに是非ご参照いただきたい。
https://drive.google.com/file/d/1B-OymgKE1dRkBcJ7fVhTs9hNqx1IuUyW/view
出典:https://news.ycombinator.com/item?id=24035480
10 https://www.technologyreview.com/2020/08/14/1006780/ai-gpt-3-fake-blog-reached-top-of-hacker-news/
11 https://youthedata.com/2020/08/04/gpt-3-what-is-all-the-fuss-about/
12 https://www.huffpost.com/entry/trump-biden-older-facebook-ads_n_5f515dcfc5b6946f3eaf3fbe
13 Bergstrom, Carl T., and Jevin D. West. Calling bullshit: the art of skepticism in a data-driven world. Random House, 2020.
14 https://www.cnet.com/news/judge-orders-fcc-to-share-net-neutrality-repeal-comment-records/
15 https://www.washingtonpost.com/graphics/politics/trump-claims-database/
16 https://twitter.com/realdonaldtrump/status/1296608655228502016
18 https://abc7news.com/chinese-consulate-san-francisco-sf-tang-juan-uc-davis/6332978/
19 https://www.reuters.com/article/us-usa-china-crime-idUSKBN1ZR23V
<CIGS International Research Fellow 櫛田健児 シリーズ連載>
米国コロナ最前線と合衆国の本質
(1) 残念ながら日本にとって他人事ではない、パンデミックを通して明らかにするアメリカの構造と力学(2020年6月9日公開)
(2) 米国のデモや暴動の裏にある分断 複数の社会ロジック(2020年6月11日公開)
(3) 連邦政府vs州の権力争いの今と歴史背景:合衆国は「大いなる実験」の視座(2020年6月25日公開)
(4) アメリカにおける複数の「国」とも言える文化圏の共存と闘争:合衆国の歴史背景を踏まえて(2020年7月1日公開)
(5) メディアが拍車をかける「全く異なる事実認識」:アメリカのメディア統合による政治経済と大統領支持地域のディープストーリー(2020年7月8日公開)
(6) コロナを取り巻く情報の分断:日本には伝わっていない独立記念日前後のニュースの詳細および事実認識の分断の上に成り立つ政治戦略と企業戦略(2020年7月22日公開)
(7) 「国の存続」と「国内発展」のロジックにみる数々の妥協と黒人の犠牲(2020年7月29日公開)
(8) Black Lives Matterの裏にある黒人社会の驚くべき格差を示す様々な角度からのデータ、証言、そしてフロイド氏殺害の詳細を紹介(2020年8月7日公開)
(9) 投票弾圧の歴史の政治力学(2020年9月3日公開)
(10)AIの劇的な進展と政治利用の恐怖(2020年10月1日公開)
(11)大統領選直前に当たり、日本にはあまり伝わっていない投票権に関する動きとその裏にある合衆国の本質的な力学(2020年11月2日公開)
(12)日本に伝えたい選挙後の分析、近況と本質的な力学(2020年11月20日公開)
(13)深刻化するコロナ、拡散する陰謀説とその裏にあるソーシャルメディアの本質(上)(2021年1月6日公開)
(緊急コラム/14)米国連邦議会議事堂制圧事件の衝撃と合衆国の本質:これまでのコラムの要素に基づく解説(2021年1月12日公開)
(15)埋まらない米国の分断と分断を深める政治戦略:コロナ対策の大きな妨げ(2021年12月17日公開)
*続編は順次、近日公開の予定