説明できる?顔認識、顔認証、顔識別、顔照合の違いと落とし穴

TOKYO2040 Side B  第八回『顔認識して顔識別して顔認証する』

 東京オリンピックからここ一ヶ月ほどのトピックとして「AI顔○○」が挙げられます。オリンピック会場の警備のために使われた、あるいはJR東日本が実証実験として駅にカメラを設置したが世間の理解が得られなかった、渋谷区が住民票発行時の本人確認(eKYC)にAI顔認証を用いたが違法状態であると総務省が見解を公表した、などの報道を見聞きしたことがあるかと思います。

■参考https://www.nikkei.com/article/DGXZQOUC218LL0R20C21A9000000/https://www.bengo4.com/c_1017/n_13538/

 ここでちょっとした混乱が起こりました。使われている技術が、「顔認識」なのか「顔識別」なのか「顔認証」なのか、表記が揺れていてサッパリわからないのです。

たった一字の違いが大きな違いを生む

 ニュース記事の表記だけではありません。先の例ではJR東日本の構内掲示には「顔認証機能付 防犯カメラ作動中」とあったのですが、英語表記には「Facial Recognition」すなわち「顔認識」と書かれています。

 本誌の連載小説『TOKYO2040』でもサイバー局の刑事が「顔認証と顔認識は違う」とこだわりを見せるシーンがありますが、「顔認識」と「顔認証」はたったの一字の違いで機能が大きく変わります。

 もちろん顔認証に使えるカメラ+コンピュータは、顔認識にも当然使えるため、「顔認証用のカメラを設置して顔認識に使用している」と強弁することは可能ですが、告知としては正確性を欠いてしまいます。

 そこで、

顔検知、顔検出(Facial Ditection)や顔抽出:画像や映像に映っているものから顔だけを探し出す。スマホのカメラアプリ画面やデジタルカメラのファインダーで、顔を検知した後にそこへオートフォーカスして枠をつける等の処理がされることでも身近な機能。

顔認識(Facial Recognition):画像や映像に映っているものが顔であるとわかる。目、鼻、口、輪郭などの特徴を認識するイメージから広く使われる言葉で、処理の違いがあってもざっくり「顔認識」と呼ばれることが多い。

顔識別(Facial Identification):画像や映像に映っている顔の範囲内で、同じ顔や違う顔を選り分ける。個々の顔の特徴を学習し、データ化したり分類して保持できるからこそ成立する機能。

顔照合(Facial Verification):画像や映像に映っている顔をあらかじめ作成しておいた一覧にある顔と照らし合わせる機能。照合したあとに「○○さんの顔です」と確認まですると「顔検証」になるが、そこまで含めて「顔照合」と呼ばれる。

顔認証(Facial Authentication / Facial Certification):画像や映像に映っている顔とあらかじめ作成しておいた一覧にある顔が同じ場合、許可してよいなら許可をする、許可していけないなら許可しない。認識の後にワンステップ、判断の過程があるのが特徴。

 スマホの進化によって「指紋認証」から「顔認証」へと時代が移りました。指紋認証は、ボタンに触れているものが指かどうかを「認識」し、それが掌など指紋以外のシワでないか「識別」し、登録されている指紋と「照合」し、スマホの操作を許可する「認証」が行われるわけです。

 それが「顔」になったと考えると、「顔認識」や「顔認証」を区別せずに呼んでしまうのが、どれだけ混乱を招くかわかることかと思います。

推し活に例えると……!

 突然ですが、アイドルの話をさせてください。

 ここ20年ほど、アイドルの形態が「グループアイドル」となるに従って「テレビに出てるアイドル、誰が誰だかわからないよね」というのが定番の話題になっていることと思います。

 名前どころかグループ名もわからない、それならまだマシで、テレビに映っているのが果たしてアイドルなのか、若手俳優なのか、芸人なのか、はたまたYouTuberなのかも区別がつかない、なんてことが十分にあり得ます。

 AIでさえ顔を読み取る時代です。負けていられない。そこであなたは一念発起して、誰が誰だかわかるくらいになろうと努めます。

 まず、テレビに映っているのがアイドルであるかどうかをわかる必要があります。いろんな手がかりがあります。出演ドラマや映画の番宣をするのはどうも俳優らしい、バラエティには出ても汚れ役まではしなさそうなのがアイドルらしい、普段のファンとテレビの視聴者層がズレているため面白いことを言いそうで言わないまま番組が終わってしまうのがどうやらYouTuberらしい……。

 確たる区分けがない中で「あれはアイドル、これはアイドルじゃない」という「学習」を繰り返すことで、アイドルが身に纏う雰囲気を感じられるようになれば「認識」成功です。この能力があれば、テレビにアイドルが映った瞬間気づくこと(検出)ができますし、ひな壇芸人に混ざるアイドルだけをピックアップすること(抽出)ができます。

説明できる?顔認識、顔認証、顔識別、顔照合の違いと落とし穴

 そして、歌番組で複数のグループアイドルが出演しているときに、この人とこの人はこっちのグループ、あの人は違うグループ、と選り分けることができれば「識別」できることになります。

 顔や背丈や衣装の特徴だけでなく、「化粧品のCMで見たことがある」「映画やドラマに出ていた」「雑誌の表紙で見かけた」「家族が待ち受け画面にしていた」「同僚がブロマイドを眺めていた」などの情報によって学習が進んでいれば、より識別は楽になるでしょう。

 けれども名前をはじめとしたプロフィールはわかりませんから、次はアイドル名鑑やエンタメ雑誌のアイドル特集号を手にします。公式Webサイトでもかまいません。テレビに映っているアイドルと写真を「照合」することで、顔と名前・プロフィールが一致します。

 ちなみにぼくは、テレビに映るたびに、間違えてもいいからそのアイドルの名を声に出して言ってみるようにしています。すると、頻繁に画面に映る人から覚えていけるようになります。

 そのうちに、プロフィールに書かれていない、アイドルの特徴や好みや背景ストーリーまで知ることになります。デビュー初期の曲を聴くにつけ、卒業してしまってもういないメンバーの声まで聞き分けられるようになり、立派なドルヲタになったあなたは、ファンクラブ会員になり、推し活をしにライブ会場へと足を運びます。

 入場時にチケットをチェックする係員が、ファンクラブ会員証と、顔写真付き身分証の提示を求めてきました。チケットの転売対策やセキュリティの観点で、入場しようとしているあなたがファンクラブに所属し、かつチケットを購入した本人かどうかを確認するのです。

 身分証の写真と顔を見比べられ、ファンクラブ会員番号とチケットの番号を照らし合わせられ、見事、あなたは係員による「認証」を通り、ライブ会場へと入ることが許可されました。

 ……最後の「認証」だけ、アイドルの見分けの話じゃなくなっていまいましたが、どういう機能なのか、処理なのか、ということはわかっていただけたかと思います。

 見分けのつかなかったアイドルたちの顔と名前やプロフィールが頭の中で一致していく過程と同様に、「顔○○」のAIも段階や用途に応じた数多くのデータを取り込んで学習をし、処理のために様々な情報を結びつけています。

本人確認に顔認証は使えない!?

 さきほどの例で、ライブの係員が「本人確認」をしましたが、冒頭に挙げた渋谷区に関する報道では「メッセージアプリで送られてきた写真画像について、AI顔認証を用い、本人確認に使用する」旨が書かれていました。

 DXにおいて、こういった「窓口業務をデジタル化する」アイディアは無数に出てきます。

 一般的に、AIによる顔認証は、あらかじめ登録しておいた顔といままさにカメラに映っている顔を照合し、AIが認証OKかどうかの判断をします。

 例えば、次のようなフローが考えられます。住民票を受け取りたい人が役所の窓口に出向き、その場に設置されているカメラで顔を映し、その映像が役所に元々登録されている顔写真と照合され、本人が来訪したのだと判断されます。その結果、住民票が発行され、その人に手渡しされます。

 これは、顔認証が通ったことを根拠とするのではなく、顔認証をツールとして使ったにせよ、何よりも「本人確認ができた」から発行されるものだと解釈できます。もう少し言うと、「元々厳密な本人確認をして登録しておいた内容を、顔認証によって引っ張り出した」となります。

 ですが、渋谷区のシステムで用いられたのは、「メッセージアプリで送られてきた写真画像」です。これは果たして照合に足るものとして機能するのでしょうか?

 答えから言ってしまうと、足りないと考えられます。これはAI顔認証に使われる顔認識、顔識別、顔照合のどの機能がどれだけ技術的に高度で信頼できるものかどうか、ということとは一切関係がありません。

 写真が偽造されたり、他人が申請してくることも考えられますが、それに対しては「住民票に記載されている住所へ郵送するので問題がない」と反論されています。でも、頼んでもいない住民票が自宅に届いたら、それはそれで気持ちが悪い出来事ですよね。

 フローに不具合があっても、人間の曖昧さで吸収できてしまえば運用上は不問とされるとのでは、まったくもっておかしな話ですね。

 もしこれを厳密に運用しようとするなら、どうしたら良いでしょうか? まず、照合用の顔写真とテレビ電話のできる電話番号と郵送してほしい住所を、AI顔認証に使用する目的でのみ、希望する住民の承諾のもと登録します。

 その上で、アプリやWebサイト経由で住民票の申請が発生したら、役所のコンピュータから登録された電話番号へテレビ電話をかけ、もし覚えのない不審な申請であればその場で断ってもらい、本人が申請したのであれば、リアルタイムに映し出される住民の顔に対してAI顔認証を用い、問題なければ登録しておいた住所へ住民票を書留で送る手順になるかと思います。

 ……顔認証、要りますかね? さらには、登録の手間など考えたら、都度窓口に来ていただいたほうが早いのでは? ということになりかねません。

 ただし、こういったことは業務によって「本人確認」と「認証」のどちらが必要なのかを違えずに企画設計をすることで解決できる問題です。この連載を毎回お読みいただいている方はすぐピンときたかと思いますが、業務フローを一度分解し、どこをデジタル化すべきか、その前後で人の行動変容が起こっているかという視点でDXを進めていく必要があります。

 慣習化された業務を改革するチャレンジは、社会におけるDX推進の流れにおいて歓迎すべきことです。ですが、技術の区別や、使い所については腰を据えて取り組まなくては出鼻をくじかれてしまい、新しい技術の芽を摘んでしまうことになりかねません。新技術へのアンテナを伸ばしつつ、それが何であるかの理解も進め、一朝一夕にはそもそもなし得ないものだと考えて、取り組んでいくのがよさそうです。

文/沢しおん作家、IT関連企業役員。現在は自治体でDX戦略の顧問も務めている。2020年東京都知事選に無所属新人として一人で挑み、9位(20,738票)で落選。

このコラムの内容に関連して雑誌DIME誌面で新作小説を展開。20年後、DXが行き渡った首都圏を舞台に、それでもデジタルに振り切れない人々の思いと人生が交錯します。

これまでの記事はコチラ

第8話は本日発売のDIMEで掲載中!

Amazon https://www.amazon.co.jp/dp/B09HFZWY4Gセブンネットショッピング https://7net.omni7.jp/detail/1230153679楽天ブックス https://books.rakuten.co.jp/rb/16906969/

文/DIME編集部

カテゴリー