Appleは木曜日に公開された特許出願の中で、インテリジェントな仮想アシスタント「Siri」をメッセージング環境に統合する方法を詳述しており、これによりユーザーはAIとのテキストベースのやりとりに参加できるようになり、友人との従来のメッセージ会話に自動化ツールやヘルパーツールが開放されることになる。 。

米国特許商標庁が発表したように、Apple の特許出願「メッセージング環境におけるインテリジェントな自動アシスタント」では、テキスト メッセージング用に設計されたグラフィカル ユーザー インターフェイスと Siri を連携させる方法について説明しています。重要なのは、この統合により、Siri は 1 人のユーザーと会話するだけでなく、グループ チャットで第三者としても機能できるようになります。

提案されたシステムは、音声認識に大きく依存している現在の Siri 実装よりもはるかに先進的であるように見えます。本日の文書で詳述されているように、Siri の統合により、ユーザーはメッセージでサポートされているあらゆる形式の通信 (現時点ではテキスト、音声、画像、ビデオなど) を使用して仮想アシスタントと「会話」できるようになります。

現在、Siri は専用の Siri UI でデバイスのマイクを介して音声コマンドを受け入れます。アシスタントは自然言語入力を高い精度で解析できますが、間違いは発生します。このような場合、ユーザーは確認テキストをタップまたは選択し、正しい情報を入力することでクエリを変更できます。 Siri には、現在の形式では画像を処理する機能もありません。

特許出願に記載されているように、Siri をメッセージング環境に移行すると、まったく新しい対話が促進されます。たとえば、騒がしい環境や、図書館や映画館などの音声対話が望ましくない静かな場所では、テキストベースの UI が適しています。

メッセージやその他のメッセージング アプリは情報を時系列形式で表示するため、ユーザーは以前の Siri とのやり取りを従来のテキスト履歴として確認できます。さらに、Siri はユーザーの質問に答えようとするときに、利用可能なチャット履歴を参照して状況に応じた手がかりを得ることができます。現在、Siri UI はセッションが完了するとクエリ スレッドを削除します。

既存の実装と同様に、コンテキスト情報は会話履歴を超えることができます。たとえば、デバイスの位置情報を利用して、「ジャイアンツはどうでしたか?」などの質問に答えることができます。生成されたタスク フローは、最初にユーザーの意図を検出します。この場合、それはスポーツのスコアの問い合わせです。デバイスの場所、時間、チームのスケジュールに応じて、Siri はサンフランシスコ ジャイアンツまたはニューヨーク ジャイアンツのスコアを返す場合があります。

後続のメッセージには、スポーツのスコアに関連するインターネット Web サイトへのリンクや、他のアプリへの内部リンクが含まれる場合があります。

興味深いことに、この文書では、メッセージベースの Siri の実行可能なユースケース シナリオとして画像とビデオの認識について言及しています。この特許出願では、クエリの一部としてユーザーによって Siri に「送信」される可能性があるフォルクスワーゲン ビートルの画像が引用されています。一例では、ユーザーが Siri に価格に関する情報を収集するよう依頼し、仮想アシスタントが識別特性を使用して画像を分析し、Web で現在の価格を検索し、テキスト形式で回答を返すように促します。

画像関連のクエリの他の例としては、「ここはどこですか?」などがあります。 「これは何の虫ですか?」 「このロゴを使用している会社はどこですか?」などなど。場合によっては、特定のクリップ内のサウンドを認識することによってビデオを処理できます。これは、オーディオ クエリの解析で説明したのと同じ方法です。

画像と音声の認識機能を有効にすると、Siri はユーザーの設定を「記憶」することもできます。たとえば、ユーザーがワインのボトルの写真を送信して「このワインが好きです」と言った場合、Siri は後で参照できるようにメモを作成します。同様に、ユーザーは連絡先情報などのテキスト ブロックを保存するために入力でき、仮想アシスタントは後で取得できるようにファイルに保存できます。

おそらく最も興味深いのは、Siri が積極的な参加者としての役割を果たすマルチユーザーの会話です。メッセージで第三者を招待するのと同じように、Siri をチャットに招待すると、AI は両方の人間のユーザーにサービスを提供できるようになります。たとえば、最初のユーザーが近くの中華レストランについて尋ねると、Siri はそのクエリに適切な店のリストを返します。 2 人目は、より安い飲食店にリストを絞り込み、特定のレストランが決まったら、両方のユーザー デバイスに保存するためのカレンダー エントリを作成したい場合があります。

さらに、Siri は後で各参加者に今後の会議を思い出させ、交通手段のオプションを提案することもできます。今日の文書で提供される例では、各 Siri アシスタントは独自の ID を持っています。たとえば、ユーザーにカレンダーへの招待をリマインドするとき、Siri は最初のユーザーに「午後 7 時のディナーを忘れないでください」というメッセージを送信し、2 番目のユーザーには「ジョン スミスの Siri がリマインドします」という別のメッセージを送信する可能性があります。今夜の午後7時の夕食についてです」

理論的には、Siri はメッセージ チャットにとって不可欠なサードパーティになる可能性があります。

この発明に関するアップルの計画は現時点では不明だ。未確認の噂が浮上3月に次世代「iOS 11」オペレーティングシステムのメッセージが何らかの形でSiri統合をサポートすることを示唆しているが、ソースレポートは憶測のように読める。

に基づいていると考えられる最近の特許出願、この機能により、Siri はメッセージの会話を盗聴して、デバイス所有者に有益な情報を提供できるようになります。たとえば、ユーザーが友人と食事をすることについて話し合っているときに、Siri が立ち寄って近くのレストランを提案したり、予約のスケジュールを立てたり、Uber の手配を依頼したりする可能性があります。このような機能については、本日の特許出願で言及されています。

AI アシスタントをメッセージング ユーティリティに統合することは、前例のないことではありません。 Googleは昨年、Allo メッセージング アプリGoogle アシスタントとの統合により、ユーザーはアプリ内で高度なチャット ボットにアクセスできるようになります。同様に、職場で人気のメッセージング プラットフォームである Slack には、Slackbot と呼ばれる、それほど高度ではない独自のチャット ボットがあり、一般的な質問に答えたり、基本的なタスクを実行したりできます。

メッセージへの Siri 統合を詳細に説明する Apple の特許出願は 2016 年 5 月に初めて申請され、Petr Karashchuk、Tomas A. Vega Galvez、Thomas R. Gruber が発明者として認められています。