Apple の技術が機械学習を 3D マッピングに適用して、正確な空中ジェスチャ認識を実現

Appleは空中3Dジェスチャ制御技術の追求を続けており、月曜日には人間の手のジェスチャを驚異的な精度で認識できるマシンビジョンシステムの特許を取得した。

米国特許商標庁が Apple の米国特許を付与第9,002,099号「手と指のポーズの学習ベースの推定」について。特殊な学習アルゴリズムを適用することで、光学 3D マッピング システムがユーザーの手のジェスチャーをより正確に識別できる方法を説明する発明。

Apple が新たに特許を取得したテクノロジーを使用すると、3D マッピング ハードウェアは、たとえユーザーの手の一部が異物で遮られた場合でも、ピースサインと握りこぶしを区別できるようになります。空中ジェスチャー制御などのアプリケーションの場合、精度により、より詳細なポーズ処理が可能になり、制御スキームの広大なライブラリへの扉が開きます。

この特許は、かなり高精度でシーンの深度マップを作成できる 3D イメージング ハードウェアに依存しています。これらのマップを処理し、手のランドマークを分離し、デジタルスケルトンファクシミリを再構築し、ランドマークの位置を相互に割り当てることにより、例示的なシステムは手の姿勢を正確に決定することができる。

Apple はすでに、深度マッピングに関連する特許を所有しています。これには、2013年購入PrimeSense は、モーション センシングと 3D スキャンのハードウェアおよびミドルウェアで知られるイスラエルの企業です。 PrimeSense テクノロジは、Microsoft の Xbox 360 用 Kinect センサーの背後にあり、ゲーマーは手や体のジェスチャーを介してマシンを制御できます。

USPTOの窓口を越えた最初のPrimeSense特許再譲渡が行われた去年今日の発明の強固なバックボーンとして機能する投影ベースの 3D マッピング ソリューションです。

一般的な認識システムでは、通常、指先、関節、手のひら、手の付け根などのグループから得られるユーザーの手のポーズやジェスチャーの推定を開始するには、少なくともいくつかのランドマーク特徴が必要です。これらの「パッチ」に関連する深度データは、後で学習エンジンによって取得できるようにビンにコンパイルされます。一連の深度マップを処理ユニットに供給すると、システムはパッチ記述子を既知の運動学のデータベースと比較対照し、手や指の配置、軌跡、空間関係、その他の指標を分析します。

重要なのは、Apple の特許では手の部分的な遮蔽が考慮されているということです。 3D マッピング デバイスがユーザーの手を認識できない場合、姿勢を合理的に決定できないことになります。ただし、おそらくユーザーのもう一方の手または人によってユーザーの手が部分的にしか視界から隠されていない場合でも、ランドマークの合理的な推定は依然として可能である可能性があります。

遮蔽された特徴を含む画像のパッチを無視するか、遮蔽されたランドマークを含むパッチを含めるが隠れた特徴を含む遮蔽されたビンを無視することによって、特定のシーンの正確な記述子を取得できます。データベースに保存されている既知の距離と運動学を適用するだけでなく、時間をかけてデータベースに追加することにより、信頼性の高い手の動きと位置データが得られます。

この特許の残りの部分では、特殊な推定アルゴリズム、信頼度の計算、重み付けの公式などについてさらに詳しく説明されています。

Appleの手と指のポーズの特許は2013年3月に初めて申請され、シャイ・リトヴァク氏、レオニード・ブレイロフスキー氏、トマー・ヤニール氏が発明者として認められている。