アニ文字の将来のバージョンでは、ユーザーの表情に基づいた音声や効果音が追加される可能性があります

Apple の Animoji は、ユーザーが記録セッション中に特定の表情をしたり、特定の単語を言ったりしたときにトリガーされる各アバターに適切な音響効果を再生することにより、顔追跡アニメーションキャラクターと対話するためのより多くの方法を提供する可能性があります。

TrueDepth カメラシステムで何ができるかをデモンストレーションするために iPhone X と一緒に発売されたアニ文字は、すぐに iOS への人気の追加となりました。コマーシャルそして "アニ文字カラオケ」ビデオをインターネット上で配信します。一方、Apple は、舌検出やユーザー作成など、顔追跡された作品にさらにインタラクティブ性を追加しました。Memoji、Apple にはアニ文字の可能性についてさらに多くのアイデアがあるようです。

あ特許出願2月28日に出願され、11月22日に米国特許商標庁によって公開された「顔の表情に基づく音声効果」は、仮想アバターのビデオクリップがどのように作成されるかに関するものですが、ユーザーが変更できる特殊効果で変更できます。トリガー。つまり、アニ文字に追加機能が追加されています。

アニ文字メッセージの録音段階で、ソフトウェアは対象者の顔の動きと音声をキャプチャします。通常、フェイストラッキングはキャラクターに直接マッピングされ、ユーザーの動きは可能な限り正確に反映されますが、オーディオトラックはその期間中にiPhoneが拾ったものとまったく同じです。

特許出願によると、視覚要素と音声要素の両方が特定の状態について監視され、再生段階で別の状態に変更できるという。これらの状態には、しかめっ面などの検出された表情や、効果を引き起こす可能性のあるトリガーワードが含まれる場合があります。

エクスプレッションがトリガーされると、キャラクターのビジュアルまたはオーディオセクションに適用されるエフェクトが作成されます。キャラクターは、表現の作成中に事前に定義されたアニメーションを実行したり、特定の方法で変更したりすることができ、同時に付随する音声をピッチシフトしたり、完全に置き換えたりすることもできます。

ユーザーの「ワン」という音声を犬の鳴き声の録音に変更する基本的な例を示します。

たとえば、犬のアバターを使用している人が「吠える」という単語を言うと、犬の吠え声の音声ファイルが再生され、それに合わせてキャラクターの口の形が変更されます。ユーザーが眉をひそめたりうなり声を上げたりすると、ピッチをシフトしたり、うなり音を置き換えたりして、愉快な犬のキャラクターを怒ったバージョンに変えることができます。

場合によっては、音声録音全体を合成音声に置き換えることができ、音声認識によって個々の単語、ピッチ、リズムが検出され、キャラクター固有の音声で再生できます。

特許出願の提出は、それが将来の Apple 製品またはサービスに採用されることを保証するものではありませんが、同時に Apple の利益がどこにあるのかを示す指標としても機能しますが、この場合、そのコンセプトは将来実装される可能性が十分にあります。 iOSのアップデート。

アニ文字の場合、すでに TrueDepth カメラを搭載した iPhone の顔追跡要素を活用しているため、Apple が感情認識を追加することが可能になります。 Siri の存在によってすでに実証されているように、音声認識機能は、特許出願の音声改ざん要素にも役立ちます。