Apple は、デジタル アシスタントにユーザーの身元を認識させることで、Siri に話しかけている特定のユーザーに対してパーソナライズされた結果を提供できるようにする方法を検討しており、クエリを 1 人のユーザーの声だけに制限する可能性も追加されています。

特許火曜日に米国特許商標庁によって付与された「音声入力処理のためのユーザープロファイリング」では、音声認識が音声によってユーザーを識別し、既存の登録ユーザープロファイルを使用する方法について詳しく説明されています。認識は生体認証情報を含むさまざまな方法で実行できますが、特許では生体認証情報は「声紋」である可能性があると示唆されています。

このプロファイルは、デジタル アシスタントがそのユーザーに対してのみ実行できる項目などのタスクを実行するのに役立ちます。

たとえば、ユーザーは新しいメッセージの読み上げを要求できますが、割り当てられたユーザー プロファイルにより、メッセージはそのユーザーが受信したメッセージのみに制限され、他のユーザーは受信しません。これは、ユーザーが撮影した写真やビデオなど、デバイスに保存されている他のコンテンツにも拡張できます。

この特許は、ユーザーがアシスタントを使い続けると、音声認識システムが使用された単語や言語スタイルをメモし、その特定のユーザー向けのライブラリを構築できる可能性があることを示唆している。これには、コンテンツのメタデータに対応する単語や、ユーザーが使用する可能性が高いアプリケーションに対応する単語が含まれる可能性があります。

このシステムは、最も一般的に使用されるアプリや頻繁に使用される連絡先など、デバイスの以前の使用状況を分析して、ライブラリの構築を支援することもできます。この種の要素には、他のユーザーによる一般的なクエリではなく、ライブラリを使用するリクエストで関連する用語が認識される可能性が高くなるように重み付けも与えられます。

音声クエリに対するユーザーの声を認識することは精度の向上に役立ちますが、このシステムには、既存のユーザビリティの問題の多くを解決する可能性があります。シリ。現在、Siri は複数のユーザーをサポートできないため、他の個人による悪用の可能性が生じます。また、誤った入力の影響を受けないわけではありません。最近のスピーチ英国議会で。

Apple は毎週、多数の特許出願を USPTO に提出し、その多くが同社に認められています。公開された特許の存在は、記載されたアイデアが商品化されることを保証するものではありません。

そうは言っても、HomePod 用 Siri のマルチユーザー サポートの魅力と、それがハードウェアの変更を必要とするのではなくソフトウェア ベースのコンセプトであるという事実により、製品化される可能性は十分にあります。マルチユーザーのサポートまた、iOS 11.2.5 ベータ版でも発見されたと報告されており、複数の音声を認識して調整された結果を提供するための基礎が整備されていることを示唆するコード文字列が含まれていますが、完全には実装されていませんでした。

また、Apple はデジタル アシスタントに対するこの考え方を、少し違った方法で既に実践しているとも言えます。

木曜日、Apple の Machine Learning Journal は、Siri の結果が、地理位置情報ベースの言語モデル(Geo-LM) 米国。 Geo-LM は、ユーザーの位置を考慮に入れることで、ローカライズされたトレーニングを使用して、全国的な一般言語モデルと比較して、地元のビジネスや興味のある場所をよりよく認識できるようにしました。