Apple は、可能な限り使いやすくしながらデバイスを保護する方法を考案し続けています。その 1 つのコンセプトには、iPhone または iPad のロックを解除して Siri リクエストを実行するというものがあります。ただし、聞こえる声が所有者のものと一致する場合に限ります。 。

火曜日に米国特許商標庁によって付与された、特許「音声認証を使用したデバイス アクセス」の場合は、比較的簡単です。つまり、音声リクエストに対して話者の音声を検出し、それがメインの登録ユーザーであるかどうかを判断します。

この特許によれば、ユーザーからの音声入力を受信できるデバイスは、ユーザーの音声の複数の例を使用して所有者の「声紋」を作成できる可能性があるという。このテキストに依存しない声紋は、デバイス上または外部サービス経由でモデルを作成するためのユーザーの声の特徴を決定し、その結果が将来のチェックのための比較点となります。

声紋は、ユーザーの音素の発音の「特徴の統計モデル」を使用して署名を作成できます。理論的には、これには、発声、沈黙、ストップバースト、鼻や液体の干渉、摩擦、その他の要素などの特性が含まれる可能性があります。

テキストに依存しないことにより、理論的には、声紋は特定のパスフレーズを使用することなく、通常の音声だけから話者の身元を判断できるようになります。これは、ユーザーが秘密にしておきたいパスフレーズを大声で言いたくない公共の場で音声ベースの認証に対処するより良い方法です。

デバイスは音声コマンドを受信すると、発声されたフレーズに基づいてモデルを効果的に作成し、それをすでに確立されている声紋と比較します。類似性に関して特定のしきい値が満たされた場合、デバイスのロックが解除され、音声コマンドが実行されます。

また、声紋の一致によって電話機のロックを完全に解除する必要はないかもしれないが、それでもユーザーに対して音声による要求を実行できる可能性があることも示唆されています。たとえば、デバイス上の Siri は、ユーザーの音声を検出した場合、一般的なトピックに関する音声クエリに対して口頭およびテキストベースの応答を提供できますが、事前に他の手段でデバイスのロックが解除されていない限り、ユーザー データを含む応答は提供しません。 。

ユーザーが個人データを使用してアクセスする可能性のある特定の機能を選択する可能性さえあります。Siriによってロック状態の間、ユーザーの音声が認識された場合のみ。これにより、デバイスはデータへのアクセスを許可せずに、他のユーザーによるユーザー固有ではない一般的な Siri クエリに使用できるようになります。

ユーザーが音声だけで自分の身元をデバイスに認識させることができない場合には、他のタイプの生体認証セキュリティやパスコードなどの二次認証方法が提供されます。

Apple は毎週大量の特許出願を提出していますが、すべてのアイデアが商品化されるわけではありません。 Touch ID や Face ID などの生体認証セキュリティに関する Apple の既存の取り組みを考慮すると、特に iPhone の Siri のコンテキストで見た場合、音声認証への拡張は理にかなっています。

この特許は、Apple がこの分野で出願した多数の特許のうちの 1 つであり、同社から明らかになったのは確かにこれが初めてではない。たとえば、2011年特許「音声入力処理のためのユーザープロファイリング」の出願は、新しく付与された特許と事実上同じアイデアを示唆しています。

8月には、Appleが声紋を少し異なる目的、つまり複数のユーザーを区別する目的で使用することを検討していることが明らかになった。

iPhone の Siri 以外に、これが役立つ可能性があるもう 1 つの分野は次のとおりです。HomePod 用 Siri、視覚的または物理的な生体認証セキュリティなしでハードウェア上で口頭応答のみを提供できるデジタル アシスタントのバージョン。マルチユーザーのサポートユーザーの音声認識により、クエリ結果をパーソナライズしたり、個人のプライベート プレイリストを再生したりする可能性もあり、スマート スピーカーとしては以前から宣伝されていました。