AppleはグループFaceTime音声通話をより現実的なものにしようとしている

Apple が音声を処理して「カクテルパーティー」効果を実装し、誰が話しているのかを簡単に判断できるようにする方法を提案しているため、複数人による音声のみのグループ FaceTime 通話は、将来的には対処しやすくなる可能性があります。

電話会議は、同時に多くの人々とアイデアを伝達することを容易にし、ビジネスに不可欠なツールとなっています。このような通話は便利ではありますが、単に参加者が多すぎるために、それ自体が問題を引き起こす可能性があります。

複数の人が通話している場合、一度に誰が話しているのかを判断するのが難しい場合があります。ビデオ通話では現在の発言者を識別するための視覚的な手がかりが得られますが、音声のみの通話にはそのような余裕がなく、音声を認識するかどうかはユーザーに任されています。

あ特許出願米国特許商標庁が木曜日に公開した Apple の「ヘッドフォンを使用したインテリジェントな拡張音声会議通話」では、ステレオヘッドフォンとソフトウェアを使用して参加者を分離する方法が示唆されています。

この問題を解決するために、Apple は、多者間通話において個々の発信者からのチャネルを個別に分割することを提案しています。これらのチャネルは、リスナーのローカル環境に適切な音響特性を備えた仮想オーディオ環境または「部屋」をシミュレートするシステムに供給され、通話が実際の部屋で行われているかのように見えます。

ユーザーを基準とした「仮想ルーム」内での複数の発信者の配置を示す Apple の特許出願

リモート発信者は仮想部屋内で間隔をあけて配置され、会議テーブルの周りなど、現実の部屋のさまざまなエリアから聞こえるリモートユーザーの声の効果が得られるように、各参加者の音声フィードが調整されます。ステレオヘッドフォンでヘッドトラッキングシステムを使用すると、ユーザーが頭を動かしている間、各リモートユーザーの相対位置を維持でき、ユーザーの向きに合わせてオーディオ特性が変化します。

Apple は、空間レンダリングオーディオシステムを使用することで、オーディオソースを分離するリスナーの脳の「カクテルパーティーメカニズム」を利用することを提案しています。つまり、音声を特定の位置に配置すると、聞き手にとって電話会議を追跡しやすくなります。

このシステムはメタデータを使用して、同僚や会社、発言の頻度、地理的位置などの詳細をインテリジェントにクラスタリングすることもできると示唆されています。各発信者の仮想方向と距離は、好みに応じてユーザーがさらに制御でき、1 人のプレゼンターが通話を主導する位置を切り替える場合のように、通話中に参加者を「移動」させる可能性さえあります。別のものと。

音声フィードがどのように処理されるかを示すブロック図

Apple は毎週多数の特許出願を行っており、USPTO による公開は同社の関心分野を示している可能性がありますが、記載されているコンセプトが将来の消費者製品に採用されるという保証はありません。

この場合、何らかの形のアイデアが機能する可能性がかなり高くなります。仮想「部屋」とオーディオの変更は、確かにモバイルデバイス上で実行でき、ステレオヘッドフォンを通じて供給されます。また、ヘッドトラッキングヘッドフォンはありませんが、iPhone の FaceTime カメラを使用して検出するなど、他のテクノロジーを使用して作業することも可能です。ユーザーの向いている方向が変わります。

これは、Apple がオーディオとヘッドフォンに関連して考案した唯一の特許または出願ではありません。 10 月と 11 月に、Apple は次の方法を使用してヘッドフォンの着用状況を検出する方法を提案しました。静電容量型近接センサーそしてマイクアレイ。

に関連する届出もある「空間ヘッドフォンの透明度」" オーディオフィードがヘッドフォンではなくユーザーの周囲から聞こえてくるようにするには、デュアルモードスピーカーとしても使えるヘッドフォンと、健康状態の監視。