やまもといちろうメルマガ「人間迷路」より

「データサイエンスと個人情報」の危ない関係


 立正大学が設立していたデータサイエンス学科の広報で、数年前から「データサイエンティスト赤ずきん」なるコンテンツを展開していて、データサイエンスがいかに大事か、どう有用かを入学希望者に説明する内容だったんですが、これが時間差で炎上する騒ぎがありました。

「モラリスト×エキスパート」を育む立正大学データサイエンス学部の『データサイエンティスト赤ずきん』がヤバい

 いい感じで黒煙が上がったので、俺たちのJ-CASTやITmediaまで便乗報道する騒ぎに拡大し、いつもの感じのネットの話題のライフサイクルのルートに乗ったなあと感慨深い気持ちになっておる次第です。

「犯罪しそう」なデータもとに逮捕する物語 物議の立正大サイトが非公開に「意見は今後検証」

立正大、“データサイエンス昔話”記事を非公開に 「オオカミの悪事を事前に予測し逮捕」に批判相次ぐ 大学の意図は

 一方で、犯罪抑止を行うのに日本やアメリカなど西側諸国でも監視カメラ画像などのデータと組み合わせて犯罪が起こりそうな地域を炙り出し、ヒートマップで展開して定点警備・警邏の計画に役立てる仕組みはすでに運用されています。アメリカでは2011年ごろから始まったデータ利活用による犯罪発生予測のシステムは試行錯誤を経て、いまでは空港や発電所周辺、議事堂など重要施設の周辺だけでなく、繁華街や商業地域などでは積極的に導入されている市・郡もあります。

 日本では、みんな大好き京都府警が2016年に鳴り物入りでデータ利用による犯罪抑止システムを導入して物議を醸していました。今回のデータサイエンティスト赤ずきんは、これらの動向を踏まえて、私たちの生活上なくてはならない地域の安全という警備・警邏の一丁目一番地についてデータ利活用の大事さを説こうとしたという点では、その動機は分からないでもない、という感じでしょうか。

 そのサブタイトルにもある通り「おばあさんを守るため、赤ずきんはオオカミの悪事を事前に予測し、現行犯逮捕しました」という、一番データサイエンスがやってはいけないことを堂々と掲載していました。何してんだよ。おかげで、本記事掲載からしばらく経った後で事態に気づいたローカス先生や新潟大学の鈴木正朝先生らネット界でももっとも面倒くさい方面に捕捉され無事に炎上と相成ったわけであります。ネットネタでPVを稼ぎたいJ-CASTやITmediaに電話取材までされた立正大学ご担当者の方は何とも可哀想で、残念でなりません。

 しかしながら、ネット上でも関係先でも、本件データサイエンティスト赤ずきんのコンテンツは、データサイエンスを人種差別に導かせる内容だから問題だ、という、ちょっと微妙に間違った指摘が相次いでいます。まあ、みんななんとなく体感で「これはヤバイ」と思ったものの、そのヤバさの本当の中身はあまりきちんと理解しないまま炎上させてしまったのではないかとも思える部分もありますので、若干の解説と補足をしたいと思っています。

・「顔認証でヤバイ動物がいたから通報」は人種差別にあたるか

 いま、アメリカでは特に、人種差別など社会問題に繋がるセンサリングは犯罪抑止の観点からも望ましくないという議論が数多く出ています。OECDでも欧州GDPRでも、本来のデータ収集の目的に合致しない分析は行わない前提となっています。

 欧州GDPRでは、データ取得の最小限原則があり、例えば犯罪抑止のために公共施設などで通行人のデータを取得する際に、犯罪抑止と関係がないデータを蒐集してはならないという方針があります。日本も欧州とのデータ連携において相互に国民のデータ保護のレベルを強調する十分性認定を出していますので、仮に日本の個人情報保護法では適法なことがあっても、域外適用される欧州GDPRの方針に抵触することは望ましくありません。

 ただ、これらの問題については、まだ「明確な解はない」「社会的なコンセンサスが固まって制度化されているとは言えない」というのが西側の状況ではないかと思います。

仮日本語訳:個人データの取扱いと関連する自然人の保護に関する、及び、そのデータの自由な移転に関する、並びに、指令95/46/ECを廃止する欧州議会及び理事会の2016年4月27日の規則(EU) 2016/679 (一般データ保護規則)

(c) adequate, relevant and limited to what is necessary in relation to the purposes for which they are processed (‘data minimisation’);
(c) その個人データが取扱われる目的との関係において、十分であり、関連性があり、かつ、必要のある ものに限定されなければならない。(「データの最小化」)

 データサイエンティスト赤ずきんの場合、その辺を通りかかった狼のツラが怪しいと割り出すにあたり、そのデータから「狼のツラは悪いことをしそうだ」と『評価』して、その行動を予測しています。仮にこれが人種であり、画像から「悪いことをしそうなツラ構え」を割り出しているのだとするならば、犯罪を起こした人でなくても監視される恐れを有することになります。それが人種や性別といったその人の責任によらない特徴で選別されて不利な分析を甘受することになるとするならば、これは人権問題だとかなりのネット民は思ったのではないかと思います。一面では私もそれは正しいと思います。

 しかしながら、不都合な真実として、公共施設で稼働している一部の犯罪抑止のシステムにおいて、往々にして画像による顔認証が行われ、不審な行動を取っていると『評価』された人物が施設で検知されるとその人物が施設から退去するまで監視カメラなどで追跡(トレース)するケースがあると見られます。

 また、犯罪予測の文脈で言うならば、ひとくちに「犯罪」と言っても様々な類型があります。商業施設では万引きが、公共交通機関では痴漢やスリが、銀行では銀行強盗が、繁華街では殴り合いが、様々な場面で相応の確率で事件が起きる確率を有します。

 問題は、往々にして「事件が起きる確率は高くない」ことにあります。毎日万引きが起きる修羅のスーパーや本屋があったり、一日三回は外出中に殴られたり尻を触られたりする被害があるような殺伐とした世界に住んでいるなら話は別ですが、特に日本は常識的な市民生活を送っている国民が刑事事件に巻き込まれる確率は極めて低く、その確率が発生するために大量の過去のデータを持ち出し、犯罪類型に基づいた「悪いことをしそうなツラ構え」を割り出して分析して犯行を事前に察知することは不可能です(応用の議論として、そのような「ハイリスクな人物」と『評価』された人が、犯行を行わないよう促すことは可能だ、という話はよく出ます)。

 これはもうほとんど地震予知みたいなものなので、赤ずきんが監視カメラなどから得られた通行人の情報をもとに「悪いことをしそうなツラ構え」をした狼を見つけたとしても、おそらく数百数千数万という数の「悪いことをしそうなツラ構え」の狼は街や森をうろうろしていることを考えれば、特定の狼が、特定の場所の、特定の時間に現れることを予測することそのものが不可能であると言えます。それでも、特定を可能な限りしたいので、警備警邏の側がすべてを監視するのだ、犯罪の可能性のある行動をとった連中は全員トレースするのだとなると、街中を監視カメラで覆いつくす中国の都市部みたいな状況になります。

 そして、そのような「悪いことをしそうなツラ構え」というのは、たいていにおいて人種の問題になるのは、どうしてそのような『評価』になるのかという部分を紐解かなければなりません。

 ここにも不都合な事実があるわけなんですが、犯罪を起こす人たちのいままでの犯行データから、これから犯罪が起きるであろう地域を炙り出すというのは、とりもなおさず犯行動機の面から犯罪者をプロファイリングしなければならないことになります。犯罪を犯す動機は、様々な犯罪類型がありますが押しなべてギャンブル・アルコールなどへの依存や異常性愛、虐待経験、他傷傾向といった、何らかの課題を内面に抱えた人たちによって起こされます。

 また、このような課題を内面に抱えた人たちは、全員が全員生まれたときから犯罪傾向をもつわけではなく、環境要因によってトリガーが引かれ、隠されていた経験や資質が発現して犯罪を思い立つことが多くあります。虐待して育ったから全員が犯罪者になるのではなく、大人になって、幸せに暮らしていない自分を思い返したときに、自分は社会から抑圧をされているのだと思い込んだり、自分は犯罪を犯さなければ生きていけないのだと強迫観念を持ったりすると、犯罪を犯さない自制的な心理的ハードルを超えて手を染めてしまうことがあるのでしょう。

 その最たるものは、経済的なものや、人間関係で引き起こされる衝動的な犯罪で、これは犯罪の全類型の8割強を占めています。残りの1割ちょっとは交通事故や経済犯罪などこの手の犯罪抑止には向かないものや累犯の人たちも含まれるので、実際にはほぼすべての犯罪行為というのは普通の人たちが追い詰められて起こす、ちょっとしたことややらかしたことで発生するものだと思って間違いはありません。

 特に経済的なトリガーについては、貧困が犯罪や薬物への逃避を引き起こすわけなんですが、街中の監視カメラの性能がいくら上がっても、その人本人が誰であるかを割り出せない限り、その人の財布の中身や銀行口座の預金残高を見ることはできません。したがって、特定の地域(例えばシカゴ市やニューヨーク市など)で通りかかったその人の経済的状況を示す一番の手がかりは人種的バックグラウンドになってしまうわけです。

 逆説的に、黒人やヒスパニックの人たちが経済的に困窮しているので、彼らがよく出入りしている地域では盗難や喧嘩が絶えないし、そういう地域にヒートマップ的には強盗殺人などの重篤な犯罪が起きる確率が高くなっているのは不都合な事実であり、では犯罪抑止をするために経済困窮してそうな人たちを見極める、その経済困窮をしているかどうかを見極めるためには黒人やヒスパニックの人たちであるかどうかを判定することが一番近いと言われて、それは人種差別に当たるのかという議論になるのもまた、致し方のないことです。

 いわば「カメラで黒人を見た→だから犯罪が起きる」のではなく、「黒人は経済的に困窮している割合が高い→黒人が商業施設に入った→黒人がプロファイリングでリスクが高いと判断される歩き方や商品の見方をしている→その黒人を監視する」というような流れになるのは、データサイエンス的に正しいんだけど政治的に正しくないということで、大きな議論になっているのは重要な観点ではないかと思います。もちろん、解などあるはずもありません。

 当然、黒人だからと言って疑われたわけではないけれども、黒人だから犯罪を犯すプロファイリングに合致すると言われたときに、それはGDPRのいう必要最小限のデータ利用なのか、という議論は起き得ます。私個人からすると、人種で判断するべきではないし、政治的に正しい方向で社会的なコンセンサスを取ることが大事だと思うんですが、こればっかりは民主主義ですのでみんなで議論して考えて手続きにのっとって決めていくしかないんだろうなあと感じます。

 で、赤ずきんがやろうとしたのはデータサイエンスではなく、クリミナルプロファイリング(Offender Profiling)になります。つまり、焦点が当たっているのはデータのように見えて、実際にはデータに乗った人への『評価』であって、それは古典的な(しかし有効な)プロファイリングの技法であることは言うまでもありません。もしも、大量の監視カメラの映像だけで『評価』された狼の犯意を掴み取り、気候や混雑状況などから犯行時間と場所を割り出して、先回りし現行犯逮捕に繋げるというのであれば、それは天才的です。そんな人は砂漠の中から針を探し出すようなデータサイエンスの世界に来るべきではありません。

 そして、もしもそのようなデータサイエンスが可能になるのだとするならば、個人の尊厳よりも社会的利益のほうが大きいと判断し、中国のような監視国家に舵を切る国もまた増えるかもしれません。思い出していただきたいのは、911テロの後でアメリカ在住だけでなく諸外国でアラブ系の人たちが航空機などへの搭乗拒否がされたり、イミグレであまり明確な理由なく入国拒否されたケースが多発した問題です。これこそが、私は人種差別だと思いつつ、これらのテロとの戦いにおいて個人の尊厳や人権がどこまで留保されるべきものなのかは実はまだ私たちはあまりはっきりしたコンセンサスがないのです。

 なので、今回の立正大学の一件は、とても大事なテーマを投げかけてくれたんじゃないかと思っています。

 ありがとう、立正大学。 

やまもといちろうメールマガジン「人間迷路」

Vol.364 データサイエンスと個人情報の問題を論じつつ、新たな日韓関係への危惧やEUのプラットフォーマー対策動向、暗号資産交換業者への新たな規制を語る回
2022年3月30日発行号 目次
187A8796sm

【0. 序文】「データサイエンスと個人情報」の危ない関係
【1. インシデント1】突然生暖かい風が吹き始める日韓関係と喉に刺さった魚の骨のようなもの
【2. インシデント2】EUは大手ITプラットフォーマーの首に鈴を付けることができるか?
【3. インシデント3】俺たちの仮想通貨界隈、ようやくアカン人排除のための外為法改正が入る模様
【4. 迷子問答】迷路で迷っている者同士のQ&A

 
やまもといちろうメールマガジン「人間迷路」のご購読はこちらから

やまもといちろう
個人投資家、作家。1973年東京都生まれ。慶應義塾大学法学部政治学科卒。東京大学政策ビジョン研究センター客員研究員を経て、情報法制研究所・事務局次長、上席研究員として、社会調査や統計分析にも従事。IT技術関連のコンサルティングや知的財産権管理、コンテンツの企画・制作に携わる一方、高齢社会研究や時事問題の状況調査も。日経ビジネス、文春オンライン、みんなの介護、こどものミライなど多くの媒体に執筆し「ネットビジネスの終わり(Voice select)」、「情報革命バブルの崩壊 (文春新書)」など著書多数。

その他の記事

「テレビの空気報道化」「新聞の空気化」とはなにか──ジャーナリスト・竹田圭吾に聞くメディア論(津田大介)
継続力を高める方法—飽き性のあなたが何かを長く続けるためにできること(名越康文)
『ご依頼の件』星新一著(Sugar)
移動速度とアイデアは比例するかを考える(高城剛)
『スターウォーズ』は映画として不完全だからこそ成功した(岩崎夏海)
Yahoo! JAPAN「爆速」の終わり(やまもといちろう)
週刊金融日記 第316号【Twitterオフパコ論の再考察とTOKIO山口メンバーはおっさんになったらモテなくなったのか他】(藤沢数希)
健康のために本来の時間を取り戻す(高城剛)
(4)視野を広げる(山中教子)
「学びとコンピュータ」問題の根本はなにか(西田宗千佳)
なぜ若者に奴隷根性が植えつけられたか?(後編)(岩崎夏海)
外資系企業の「やり得」を止められるルール作りこそがAI規制の本丸(やまもといちろう)
「見て見て!」ではいずれ通用しなくなる–クリエイターの理想としての「高倉健」(紀里谷和明)
「意識高い系」が「ホンモノ」に脱皮するために必要なこと(名越康文)
総務省家計調査がやってきた!(小寺信良)
やまもといちろうのメールマガジン
「人間迷路」

[料金(税込)] 770円(税込)/ 月
[発行周期] 月4回前後+号外

ページのトップへ