人工知能・AIが発達する中で、その技術は顔認証システムにも取り入れられています。AIの活用によって顔認証はさらに便利になっていますが、なぜAIを取り入れると顔認証は便利になるのでしょうか。そこでこの記事では、主に以下のことを詳しく説明します。
・AIと機械学習・深層学習の違い、関係性
・機械学習とは何か
・機械学習・AIを利用した顔認証の仕組みとメリット
機械学習を用いたAIサービスの事例も紹介しているので、ぜひ参考にしてください。
AI技術における機械学習と深層学習
AI技術においては、「機械学習」や「深層学習」と呼ばれるものが用いられています。2つの仕組みや違いは何でしょうか。ここではAI技術における機械学習と深層学習について詳しく説明します。
AIと機械学習、深層学習の繋がり
よく混同されますが、AIと機械学習・深層学習は違う意味を持ちます。AIとは、「人間と同じような思考プロセスを持つ知能、もしくはそれを実現するためのプログラム」のことで、そのAIの中に機械学習が含まれ、さらにその機械学習の中に深層学習が含まれるという構造です。
機械学習とは、コンピューターに入力された大量のデータからパターンや規則を特定し、未知のデータを予測して判別することです。また、深層学習は機械学習を発展させたもので、人間が判別している物の特徴を自動で抽出してくれます。
例えば機械学習であれば、食べ物の特徴を「色」で判別することを人間が指定するのに対し、深層学習は人間が指定しなくとも自動で「色」や「形状」を特徴点とし、食べ物を判別することができます。
機械学習(マシンラーニング)の学習方法
機械学習の手法には、大きく分けて「教師あり学習」「教師なし学習」「強化学習」の3つがあります。
教師あり学習
教師あり学習は、入力したデータと答えを一緒にコンピューターに学ばせる手法です。例えば、電子メールのスパム判定に使われます。「これはスパムメール」と大量に正解データを与えておくことで、実際にスパムメールが来たときにスパム判定ができるのです。
教師なし学習
教師なし学習は、正解を与えずにコンピューターに学習させる手法で、正解がないため、コンピューターは与えられたデータから規則やパターンを抽出します。例えばデータを類似しているものごとにクラス分けする「クラスタリング」が該当します。クラスタリングの具体例としては、購買データから季節や天候によって売り上げが増加する商品をマッピングすることなどが挙げられますが、この「マッピング」に教師なし学習が適しているのです。
強化学習
強化学習は、教師なし学習のように与えるデータに正解がない学習方法で、コンピューターが出した結果に報酬を与えていき報酬を最大化するように試行錯誤させる方法です。例としては、掃除ロボットが挙げられます。高性能な掃除ロボットは、ごみという報酬を得ながら、ごみの多い場所をマッピングして経路を修正していきます。
深層学習(ディープラーニング)の学習方法
ディープラーニングは、生物の脳を構成している神経細胞・ニューロンをモデルにした「ニューラルネットワーク」と呼ばれるアルゴリズムを用いた学習方法です。
ディープラーニングの場合、用いられているニューラルネットワークの種類によって、学習方法が異なります。ここでは、よく知られるものを紹介します。
畳み込みニューラルネットワーク(CNN)
CNNは、畳み込み層とプーリング層が含まれているニューラルネットワークです。畳み込み層とは、細かく分けたフィルタを用いて特定の特徴を抽出する層です。フィルタを用いて画像を1ピクセルずつ移動させ、フィルタに適合パターンがあるかを調べて出力します。入力された全データをスキャンし、フィルタと類似があったかどうかの結果を集めたものを「特徴マップ」と言いま
プーリング層は、「ダウンサンプリング」と呼ばれるサイズを小さくする層です。例えば最大プーリングを利用する場合は各領域のピクセルを比較し、その中の最大値をその領域の特徴量として抽出することで画像のサイズを小さくします。そうすることでネットワークが学習する必要があるパラメータ数を減らしているのです。
このように、畳み込み層で画像の特徴を抽出し、プーリング層で重要でない部分をフィルタリングして分析するのがCNNです。CNNは画像認識や動体検知に多く利用されます。
再帰型ニューラルネットワーク(RNN)
RNNは、時系列データを扱えるようにしたニューラルネットワークです。入力された単語を独立したものとしてみるのではなく、ある単語と関連性があるものとして時系列データとして捉えることができます。ただ、長い系列データの学習には不向きなことがデメリットです
RNNは、前後の文脈の理解に優れるため音声認識や自然言語翻訳に使用されています。
LSTM
長いデータの処理には不向きというRNNのデメリットを解消するために開発され、自然言語処理で利用されているものがLSTMです。学習状況を保存できるメモリや、「忘却ゲート」を追加することで長期的な学習も可能です。
LSTMは、動画にリアルタイムで字幕をつける機能などに活用されています。
機械学習を用いたAIサービスの事例
それでは、機械学習を用いたAIサービスの事例を詳しく見ていきましょう。
顔認識
顔認識は、教師あり学習が使用されています。大量の「人の顔のデータ」をコンピューターに読み込ませ、教師あり学習で学習させます。その学んだ特徴で未知のデータが入力されたときに人の顔を判別するのです。
例えば、特徴として「目」「鼻」「口」を学ばせた場合、他の車や動物の画像もある中で目と鼻と口の特徴が同じ、人の顔だけを認識することができます。
レコメンド機能
ECサイトなどで、過去の購入履歴を元に「おすすめ製品」を表示する機能も機械学習の教師なし学習を用いています。過去に購入した製品や検索履歴などから、教師なし学習で同じような製品に分類(クラスタリング)された製品をおすすめ製品としてレコメンドしています。主に、インターネットショッピングサイトなどで活用されています。
データ分析
大量のデータをAIに学習させ、分析させることも可能です。例えば、食品スーパーで廃棄ロスを減らすために、過去の購入データから欠品状態の把握や棚前通過人数当たりの購入予測をすることで、購入のチャンスロスの改善に繋げたケースもあります。
自動車運転
自動車の自動運転もAIが活用されている例です。自動運転では、周囲の状況を知ることが求められますが、そのために物体認識や位置特定などが用いられています。車体カメラによって周囲を認知し、自車の走行位置を正確に認知することで、周囲との距離や前を走る自動車のスピードを検知し減速も可能です。また、強化学習も用いることで、最適な走行を導き出すことができるのです。
在庫管理
顧客の購買データをAIが解析し、天気や季節、曜日などの購買データのパターンを導き出すことができます。それによって発注する数量も最適な数量に変更でき、在庫廃棄の心配なく仕入れを行えるようになるのです。
AI顔認証の仕組みとメリット
至る所に使用されているAIサービスですが、顔認証にも深層学習が用いられています。ここでは、AI顔認証の仕組みとメリットについて説明します。
AI顔認証の仕組み
顔認証には、2D顔認証方式と3D顔認証方式の2種類があります。
2D顔認証方式
目・鼻・口などの位置を抽出し、それをデータベースにあらかじめ登録されている個人情報と一致させることで認識させる方法です。
3D顔認証
2D顔認証の顔の特徴の抽出に加えて、赤外線によって顔を立体的データとして認識させる方法です。この方法は、顔写真による認証もできず2D顔認証方式より精度も高いですが、赤外線センサーなど特別な装置が必要になります。
顔認証の仕組みとしては、認証前に事前に顔を登録しておきます。そしてカメラで認識した画像から顔を検出し、目や鼻、口などの特徴点を抽出して人の顔を認識するのです。認識した顔と事前に登録しておいた顔が一致すれば、認証できます。
AI顔認証のメリット
AI顔認証のメリットは、高性能な顔認証が可能である点です。AIは、画像を元に人物を判定し、合っているか合っていないかを何度も学習させます。何度も学習させることで精度を上げているのです。顔認証システムにはその学習させたプログラムが組み込まれているため、高精度な顔認証が可能になります。
また、AIを搭載することで「目に重点を置いて認証する」「マスクありで認証する」といったことも可能になります。深層学習においては、高いレベルの認識精度が実現可能なのです。
AIの成長により顔認証技術は進化を遂げる
AIには機械学習や深層学習も含まれており、その学習方法はさまざまなものがありました。顔認証はAIの導入により精度が上がり、より便利な技術へと進化しています。これからの認証は、マスクをしていても非接触で認証ができる顔認証の需要がより増してくるでしょう。
精度が高く、便利な顔認証の導入を検討するのであればJCVの顔認証クラウドである「JCV Cloud AnySee」がおすすめです。マスクをしていても高い認証精度を誇り、アプリでの顔認証や、顔認証決済にも対応しています。顔認証システムについてご検討されている方は、ぜひJCVまでお問い合わせください。