デベロッパーブログ

顔認識用トレーニングデータの収集方法 Part1

公開日:

スマートフォンでの顔認証サインイン、スポーツや音楽イベントでの顔認証入場など、日常生活に浸透しつつある顔認識システムは、当然ですが、突然に空から現れたわけではありません。緻密な改善を目指し、数えきれない時間と尽力を注いだ産物です。このプロセスの中心はデータの役割です。競合するさまざまなバイオメトリクス認証技術の中で、システムがユーザーの期待に応えているかどうかを判断する上で極めて重要です。

私たちが2023年12月に実施した「生体検出AIモデルの訓練データ収集イベント」に関する詳細レポートをシリーズとしてご紹介します。企画段階から最終的なエンジン構築まで、各セクションのリーダーの話を交えた内容を通して、ユニークな洞察を得ることができます。第1回として企画段階からシナリオの作成までをお届けします。

シリーズの予定内容:

  1. 収集ツールとパイプラインの設計(第1回)
  2. 参加者と場所を見つける(第1回)
  3. シナリオの作成(第1回)
  4. データの整理(第2回)
  5. 手動レビューは必要か?(第2回)
  6. データセットの完成(第2回)
  7. なぜもう一度チェックするのか?(第3回)
  8. データセットを組み合わせる(第3回)
  9. データ分割の作成(第3回)
  10. まとめ(第3回)

1.収集ツールとパイプラインの設計

今回のイベントでは、人々の顔の角度や顔のアクセサリー(例えばメガネ)など、様々な状況下で約100枚の画像を1人あたり収集することを目指しています。また、RGBカメラ、赤外線センサー、熱センサーを搭載したデバイスを用いた収集も計画しています。JCVのプロジェクト・リーダーは、データ収集プロセスの形成において極めて重要な役割を果たしました。MLエンジニアと継続的に議論し、必要なデータの性質を正確に把握し、プロジェクトには「2つの異なるアプローチが必要」と結論付けました。

収集ツールの設計
高品質なデータの収集には、適切なツールが欠かせません。トレーニング用の画像と、オンライン化された際にサービスが受け取るデータをうまく整合させることは非常に重要です。私たちのイベントでは、特別に開発したアプリケーションを使用します。このアプリは単に写真を撮るだけでなく、撮影した画像を効率的に整理し、タグ付けする機能も備えており、データ収集プロセスをよりスムーズで効果的なものにします。

イベントの交通設計
高品質なデータの収集には、適切なツールが欠かせません。トレーニング用の画像と、オンラインイベント中の交通の流れは、プロジェクトリーダーが特に重視した二つ目の設計要素です。効率を最大限に引き出すため、従来の「リニアフロー」スタイルではなく、より自由な「フリーフロー」スタイルを選択しました。「リニアフローは整頓されており、参加者の進行状況を把握し易い。ただ、各収集ステージの時間消費を正確に管理できない場合、待ち時間が増えてしまう。参加者が列に並んで待つ時間よりも、データ収集に時間を費やしてほしい」という見解です。

私たちは計画の初期段階で動線の設計を検討しましたが、本来は2つの重要なステップの後に対処するのが一般的です。重要なステップのひとつが、このプロジェクトで最も困難とされる「適切な参加者を見つける」ことです。


2.参加者の確保

適切な参加者を確保することは、大きな課題でした。顔認識技術を扱うベンダーとして、写真撮影に同意した個人に報酬を支払うことは本プロジェクトには不可欠でした。さらに、参加者のデータが厳格にトレーニングとベンチマーキングのみに使用され、社内のデータベースにのみ保持されることを保証しました。

参加者の確保には2つの選択肢が存在しますが、現実的な選択先としては実質1つです。以下にて説明をします。

オプション1: イベント企画の専門会社に発注する

  • 利点:専門ベンダーは信頼と経験により、イベントを成功させるノウハウがある
  • 利点:適切な参加者を見つける手助けをしてくれる
  • 利点:法律的な側面を効果的に管理・対応
  • 利点:非技術的な作業の大部分を担う
  • 課題:コストが高く、コーディネーションに多くのエネルギーと時間を必要とする

オプション2: 自社で参加者を見つける

自社で実施する場合は時間がかかり、法的にも品質的にも問題が生じる可能性があります。例えば以下のような問題に直面します。

  • 参加者が見つからない
  • 参加者が現れない、あるいは協力してくれない
  • 参加者との契約を早期に見直す必要がある
  • 参加者の同意の管理

検討の結果、自社で対応する場合(オプション2)のコストとリスクはもう一方(オプション1)の選択肢を容易に上回り、選択する先としてはオプション1のみとなりました。


3.シナリオの作成

私たちの目的は、データが実際のユースケースのシナリオをできるだけ忠実に反映するようにすることでした。つまり、背景、照明、参加者とキャプチャデバイスの距離、年齢や性別のような人口統計学的変数などの要素を考慮しながら、実際のアプリケーションを念頭に置いてデータ収集シナリオを設計することでした。

しかし、1回のイベントでさまざまなシナリオを網羅的に把握するのは大変な労力を要します。そのため、私たちのプロジェクトリーダーは、最も関連性が高く、インパクトのあるシナリオを特定し、優先順位をつけることが重要でした。そのためには、予算、使える時間、イベント・スペースの制限、現実的な状況など、さまざまな要素のバランスをとる必要がありました。

イベントを終えて

プロジェクト・リーダーはさまざまな要因や課題に直面し、多様なスキルが試されました。イベントを成功させるために最も重要なスキルについて尋ねると、プロジェクト・リーダーは「想像力が鍵です」と強調しました。関係者とコミュニケーションをとり、彼らのニーズを理解し、データ収集のシナリオを創造的に思い描くことです。

参加者がセットアップとどのように相互作用するか、照明条件の違いが結果にどのような影響を与えるか、参加者を混乱させる可能性のあるものやプロセスを中断させる可能性のあるものなど、あらゆる可能性を想像することが求められます。

プロジェクト・リーダーは笑顔で続けて、「今回のイベントでは、限られた数の画像収集デバイスを考慮しつつ、大量のデータを収集する必要があるため、待ち時間を最小化し、柔軟性を保つことを最優先としました。幸い、全てが計画通りに進みました。」と語りました。

2023年12月に開催されたイベントでは、日本コンピュータビジョンは次世代の生体検出AIモデルの訓練に十分な画像を収集することに成功しました。


次回のブログでは、データ収集後のプロセスと、データサイエンティストが果たす重要な役割について詳しく探ります。お楽しみに!

CONTACT

ご相談、お⾒積もりのご依頼
などお気軽にお問い合わせください。

日本コンピュータビジョン(通称:JCV)について

日本コンピュータビジョン株式会社は、ソフトバンク株式会社を親会社とするAIカンパニーで、
画像認識技術を活用し、“スマートビルディング分野”と“スマートリテール分野”に対して
最先端ソリューションを提供します。