【CEDEC 2009】SCEが画像認識を語る〜「画像認識技術とゲーム・インターフェイス」 | GameBusiness.jp

【CEDEC 2009】SCEが画像認識を語る〜「画像認識技術とゲーム・インターフェイス」

コンピューターが画像を認識する。近年注目の技術ですが、その鍵は「引き算」にあるようです。株式会社ソニー・コンピュータエンタテインメントの鈴木 健太郎氏、掛 智一氏と、ソニー株式会社の尾上 直之氏と大久保 厚志氏が画像認識の不思議を解き明かしてくれました。

その他 その他
コンピューターが画像を認識する。近年注目の技術ですが、その鍵は「引き算」にあるようです。株式会社ソニー・コンピュータエンタテインメントの鈴木 健太郎氏、掛 智一氏と、ソニー株式会社の尾上 直之氏と大久保 厚志氏が画像認識の不思議を解き明かしてくれました。
  • コンピューターが画像を認識する。近年注目の技術ですが、その鍵は「引き算」にあるようです。株式会社ソニー・コンピュータエンタテインメントの鈴木 健太郎氏、掛 智一氏と、ソニー株式会社の尾上 直之氏と大久保 厚志氏が画像認識の不思議を解き明かしてくれました。
  • コンピューターが画像を認識する。近年注目の技術ですが、その鍵は「引き算」にあるようです。株式会社ソニー・コンピュータエンタテインメントの鈴木 健太郎氏、掛 智一氏と、ソニー株式会社の尾上 直之氏と大久保 厚志氏が画像認識の不思議を解き明かしてくれました。
  • コンピューターが画像を認識する。近年注目の技術ですが、その鍵は「引き算」にあるようです。株式会社ソニー・コンピュータエンタテインメントの鈴木 健太郎氏、掛 智一氏と、ソニー株式会社の尾上 直之氏と大久保 厚志氏が画像認識の不思議を解き明かしてくれました。
コンピューターが画像を認識する。近年注目の技術ですが、その鍵は「引き算」にあるようです。株式会社ソニー・コンピュータエンタテインメントの鈴木 健太郎氏、掛 智一氏と、ソニー株式会社の尾上 直之氏と大久保 厚志氏が画像認識の不思議を解き明かしてくれました。

掛氏は、デジタル画像=ピクセル(画素)の集まりであり、これを取り出して演算するのが「画像処理」であり、ぼかし、シャープ化、エッジ検出といった処理はいずれも計算の元で行われている……と語ります。

画像認識に欠かせないのが「二つの画像が似ているのか否か、比較すること」ですが、実はこの比較は引き算で行われています。ピクセルも突き詰めれば数字になるので、Aという画像を構成するピクセル(の数値)からBのピクセル(の数値)を引き算するのです。0になれば完全に同じ画像、差が大きければ違った画像、小さければ良く似た画像となります。こうした計算は「パターンマッチング」(類似度計算)と呼ばれています。

動画、といっても突き詰めれば静止画の集合体なので、「1コマ目の画像−2コマ目の画像」と引き算すれば、その差が「動いた部分」となり、動きを認識できるという訳です。常に画面全体を比較していたのでは計算回数が多くなりすぎます。そこで、限定した範囲をサーチする「ローカルサーチ」で負荷を減らしていきます。例えば、顔や手が一瞬で1mも2mも動くことは普通あり得ません。ですから、常時画面全体をサーチする必要はなく、常識的に動くであろう範囲のみを見れば良いわけです。画像認識の世界では色が扱われることはなく、輝度の8ビットのみ。カラーだと処理が重くなりますし、色情報は扱いが難しいと掛氏は指摘します。

エンターテイメントロボットの顔認識などを手がけた大久保氏は、ソニーの顔認識が「顔検出→顔パーツ検出→顔属性検出→顔識別」といった手順で行われていると明かします。ソニーの顔認識は20×20ピクセルを最小単位として、あらゆる人種の老若男女の顔を検出可能。さらに顔が笑顔であるかどうかの属性も判断できるといいます。

画像データはグレースケール化され、統計的な顔データを集めた「顔検出辞書」と照合することにより、“そこに顔があるかどうか”が判断されます。目・鼻・口といったパーツは「パーツ辞書」から検出され、「属性辞書」が笑顔かどうか、大人なのか子供なのか、男性なのか女性なのかという属性を判断。個人識別は、自分の顔を登録した個人用の辞書と照合することで行われるといいます。

照合は画像のサイズを変えながら何度も繰り返されるのですが、画像のサイズが大きく、深い奥行きまで検知するのであれば計算回数も多くなります。640ピクセルの画像であれば20万回、480ピクセルなら10万回……と画像が小さくなれば精度は落ちるものの計算回数は劇的に少なくなっていきます。ゲームに顔認識を使うのであれば、奥行きを限定することで処理を軽くできる、と大久保氏は語ります。

プレイステーション3の顔認識はほぼSPUのみで行われるため、複数のSPUを割り当てることで高速化を実現。カメラに写った人の顔をアバターの顔に置き換え、口を開けたり目線を動かしたりと表情を同期させることも可能といいます。顔の認識に使われる各種辞書はソニーのグループ全体でシェアされており、デジカメを始めとした様々な製品に使用することで精度と効率が高められています。デモンストレーションが行われたのはプレイステーション3のみでしたが、PSP用の顔認識ライブラリも近日中に提供予定とのことで、実現すればゲームの可能性がさらに広がりそうです。
《水口真》

この記事の感想は?

  • いいね
  • 大好き
  • 驚いた
  • つまらない
  • かなしい
【注目の記事】[PR]

関連ニュース

特集

人気ニュースランキングや特集をお届け…メルマガ会員はこちら