報告書によると、顔認識の分野では、誤用に気づいていない被験者で構成される複数の写真データベースを使用することで進歩が見られているが、多くの企業や研究者が画像とその結果データを収集して共有している一方で、Appleは情報源の一つではありません。
顔認識の向上を目指した絶え間ない取り組みにより、研究者は、さまざまなソースから顔で構成される膨大な画像データベースを収集するようになりました。ニューラルネットワークが学習するためにより多くのデータを取得する必要があるため、これらのデータベースはチーム間で共有され、さらに大きなデータベースを作成しているとも報告されています。
によるとに ニューヨークタイムズ、データベースのソースとなる画像の一部は、ソーシャル メディアの投稿から OKCupid のような出会い系サイトに至るまで、一般に公開されている画像からスクレイピングされています。場合によっては、レストランや大学キャンパスなどの公共の場所にあるカメラが顔データを取得するために使用されているとされています。
データベースがどれだけ存在するかについては不明ですが、マイクロソフトやスタンフォード大学などの組織がまとめた顔認識トレーニングに使用される画像アーカイブがあります。サイズに関しては、2 つのデータベースにはそれぞれ 1,000 万枚以上、200 万枚以上の画像が含まれていると言われています。
多くの画像では、そこに登場する人々は、画像が顔認識トレーニングやその他の目的で使用されていることを知りません。さらに、画像の使用状況を知っている人が、その画像が他の組織と共有されていることを認識する可能性はほとんどありません。
大手テクノロジー企業のようなフェイスブックそしてグーグルは人間の顔に関する最大のデータセットを作成したと考えられているが、研究論文は企業がその情報を他者に配布しないよう勧告している。しかし、報告書は、他の小規模な組織は、民間企業と政府の両方を含む他の企業とデータを共有することに積極的であると主張しています。
このデータの共有に加え、移民局や関税執行官が運転手の写真の顔認識を利用して米国への不法移民を特定するなどの活動が発覚したことにより、画像に映っている人物のプライバシーへの影響について批評家から不満の声が上がっている。
一例として、スタンフォード大学の研究者らによる「Brainwash」と呼ばれる 2014 年のプロジェクトでは、同じ名前のケードでカメラを使用して 3 日間にわたって 10,000 枚以上の画像が撮影されました。 Brainwash のデータはその後、研究者らによって、国立国防技術大学に関連する中国の学者や監視技術会社 Megvii などの他の人々と共有されました。
Microsoft の場合、同社は「MS Celeb」という、10 万人以上の人々の 1,000 万枚以上の画像を収録したデータベースを作成しました。このデータベースは、主に著名人や公人で構成されていますが、プライバシーとセキュリティの活動家も含まれています。この場合も、データベースは国際的に配布されていたことが判明しました。
スタンフォード大学とマイクロソフトは、プライバシー侵害の可能性に関する個人からの苦情を受けて、データベースを配布から削除しました。
「こうした慣行が押し付けがましいことが分かるようになり、これらの企業がプライバシーを尊重していないことが分かる」と、ニューヨークに本拠を置くAI新興企業クラリファイをその手法をめぐって退職した活動家リズ・オサリバン氏は語った。 「顔認識が広く普及するほど、私たちがそのプロセスに参加していることにさらされることになります。」
Clarifai は、サイト創設者の 1 人がスタートアップに投資していたため、OkCupid の画像と、ソーシャル メディア会社との契約により写真を使用し始めました。同社は、年齢、性別、顔の人種を特定できるサービスを開発し、また、安全でない監視カメラが使用されている公共および私的空間からさらに多くの画像を取得するために、ウェブサイト「Insecam」から画像を収集するツールの開発にも取り組んでいたと伝えられている。従業員の抗議を受けて取り組みは中止された。
創設者兼最高経営責任者(CEO)のマット・ザイラー氏によると、同社は適切な状況下で政府、軍、法執行機関に顔認識システムを販売するつもりであり、技術販売を特定の国に制限する理由は見当たらなかったという。
プロジェクトに使用されたさまざまなデータベースでは公的に入手された画像や他の企業が収集した画像が使用されていましたが、Apple から提供された画像はありませんでした。
同社は人工知能と機械学習の研究を行っており、その研究の一部を共有しています。2017年から、会社のその後の年積極的に予防するそのような共有が行われないようにします。
Apple が研究活動にどのような種類のデータセットを使用しているかは不明ですが、顧客から入手したものではないでしょう。 Apple はプライバシーを強く支持しており、Apple に提供されるユーザーデータの量を可能な限り最小限に抑える製品とサービスの構築に取り組んでいます。
例えば、顔認証iPhone のロックを解除するために顔認識を使用しますが、この技術はユーザーの深度マップのアルゴリズムを使用し、それを以前にスキャンした顔の結果と比較します。 iPhone にはユーザーの顔の正確なマップは決して保存されず、スキャン後のアルゴリズムの結果のみが保存されます。
また、Apple がどのように行ったかを考慮すると、Apple が独自の研究目的で顔データを収集することを正当化することも困難でしょう。公に宣伝するそのプライバシーとセキュリティの認証情報。