シリ

By Isamu

Apple のスマート アシスタントは 10 年以上前に発売され、その間に大きく進化しました。 Siri は自然に聞こえ、会話形式でクエリに応答し、以前の会話を記憶し、生活のさまざまな側面を制御できますが、すべてプライベートで安全なままです。

Siri で使用されるニューラル ネットワークとアルゴリズムは、デバイス上とクラウドの両方で動作して、ユーザーに情報を提供します。ただし、スマート アシスタントは依然としてクラウド コンピューティングに大きく依存しており、オフラインで使用すると制御システムのアクション以上のことはできません。

Apple インテリジェンスを備えた Siri

Siri は、人工知能を製品ラインに統合するという Apple の取り組みである Apple Intelligence から大きな恩恵を受けることになります。 Apple はセキュリティに誇りを持っているため、Apple Intelligence の多くはデバイス上で行われます。

Apple Intelligence をベータ版でテストする

さらに、Apple は Apple Intelligence を「パーソナル インテリジェンス」と表現しています。その主な焦点は、新しいユースケースに焦点を当てるのではなく、ユーザーがすでに使用しているアプリやサービスとのインターフェース方法を改善することです。

Apple Intelligence は、M シリーズ Mac と iPad、および A17 Pro チップ以降を搭載した iPhone に限定されています。

おそらく、Siri は Apple Intelligence のレパートリーの中で最も大きな恩恵を受けているのかもしれません。現在、Apple の顧客によって 1 日に何百万ものクエリが実行されており、成功の度合いはさまざまです。

Siri は、すべてデバイス上でローカルに個人情報を利用できるようになります。これは、ユーザーとユーザーのニーズをよりよく認識できることを意味します。

テキスト、電子メール、写真、ビデオ、スケジュールなどに関する質問に答えることができます。重要なのは、これは他の AI アシスタントでは同じ程度のプライバシーを保って実行できないことです。

新しい呼び出しアニメーションも追加され、以前に使用されていた小さな光る球ではなく、画面の端が光るようになりました。 Siri もクエリをよりよく理解できるようになりますが、AI 機能の追加は 2025 年初頭まで期待されません。

Appleはすでに開発者に対し、Siriに画面上のコンテキスト認識を提供する新しいアプリインテントシステムの開発に着手するよう要請している。 ChatGPT 統合は iOS 18.2 で利用可能です。

LLM チャットボットとしての Siri

Apple Intelligence の出現と Siri との統合にもかかわらず、Apple のスマート アシスタントは依然として AI バックエンドを実行していません。早ければ2026年にはiOS 19で状況が変わる可能性がある。

Siri は LLM バックエンドでさらに賢くなる予定です

Apple は 2025 年 6 月に iOS 19 を公開する予定ですが、Siri を大規模言語モデル (LLM) で実行するための機能セットは、オペレーティング システムのリリース サイクルの後半まで登場しない可能性があります。これは、Siri を ChatGPT に近づけるための最後のステップになります。

現在、ユーザーは Siri に話しかけたり、入力したりできますが、以前と同じ方法でデータを解析しています。 Siri バックエンドにこれらのツールが組み込まれているのではなく、リマインダー、電話、Google 検索などのさまざまなシステムを呼び出します。

Apple Intelligence と ChatGPT の導入により、その相互作用がさらに促進されました。ユーザーが Siri に電話をかけると、それが AI ツールまたは ChatGPT に関連している場合、Siri はそのデータを関連システムに渡します。

LLM Siri は、ユーザーについて知っているデータを使用して、すべてをローカルかつプライベートに処理できる必要があります。 13歳のスマートアシスタントにとっては大きな変化となるだろう。

プライベートクラウドコンピューティング

Apple Intelligence の多くはデバイス上で実行されますが、場合によっては外部のコンピューティング能力を利用する必要があります。プライベート クラウド コンピューティングにより、セキュリティとプライバシーを維持しながら Apple Intelligence がクラウドで動作できるようになります。モデルは、Swift のセキュリティ面を使用して、Apple Silicon を実行するサーバー上で実行されます。

リクエストがクラウド サーバーに送信されるか、ローカルで処理できるかどうかに応じて、デバイス上のプロセスが機能します。

Apple は、サーバーは安全であり、ユーザーデータは保存せず、セキュリティを維持するために暗号化要素を使用していると主張しています。これには、サーバーが独立した専門家による検査のために公的にログに記録されていない限り、決してサーバーと通信しないデバイスが含まれます。

Siriの機能

以下は、Apple Intelligence を使用しない Siri についての説明です。ほとんどの Apple ユーザーは、HomePod、古い iPhone、Apple TV でこのバージョンの Siri を引き続き使用します。

Siri は、Apple エコシステムのほぼすべてのデバイスに組み込まれているスマート音声アシスタントの総称です。また、機械学習を取り巻くすべてのテクノロジーと、スマートな提案に使用されるオンデバイス インテリジェンスも含まれています。

他のスマート アシスタントとは異なり、Siri にはホームと呼べる中央ハブやスピーカーがありません。のホームポッドそしてホームポッドミニApple が販売している「Siri デバイス」に最も近いものですが、そのようには宣伝されていません。

Siri は話者に基づいてリクエストに応答します

アップルが買収SRI のオリジナルの音声アシスタント。SRI は、同じ名前のアプリを開発していた調査会社です。アプリストア。その後すぐに、Apple は Siri をiOSiPhone 4Sと同時発売。

当初、Siri は単純なコマンドに応答できるかろうじてタスク マネージャーでした。 Apple は競争に負けないよう、ゆっくりと機能を追加し、Siri の知能を向上させてきました。

Siri の仕組み

タップ、プレス、またはスリープ解除コマンドを使用すると、Apple のスマート アシスタントはすべての Apple デバイスで簡単に起動できます。ユニバーサル ウェイク ワード「Hey Siri」を使用すると、ほぼすべての Apple デバイスからコマンドやクエリを実行できます。

iOS17そしてホームポッドソフトウェアバージョン17, 「Hey」が削除され、ユーザーはコマンドの前に「Siri」と言うだけで済むようになりました。

話すとき、コマンドはローカルで処理され、デバイス上で実行できるかどうかが判断されます。そうでない場合は、ランダムな識別子を使用して Apple サーバーに送信されます。すべての音声データはエンドツーエンドで暗号化されるため、Apple やその他の第三者による覗き見を心配することなく、すべてのデータが同期されます。

デバイスはウェイク ワードをリッスンし、どれが応答するかをポーリングします。

Siri インテリジェンスは、さまざまなタスクに機械学習を使用します。電子メールやメッセージ内のカレンダーの予定を検索して提案したり、Web ページを提案したりできます。サファリのリンクからiメッセージ、ユーザーが最近操作した Web サイトやニュース記事に基づいて、スマートなテキストの提案を提供します。また、頻繁に実行するタスクや 1 日の特定の時間帯に実行するタスクも推奨されます。

サードパーティの開発者は Apple API を利用して、独自の統合機能を作成できます。 HomePodのようなデバイスは、Appleが自社サービスを優先しすぎていると考えた規制当局によって厳しく監視されていた。企業は API を利用して、Spotify などのサービスを HomePod に追加できるようになりました。

Siriコマンド一覧

Apple は音声アシスタントに多くの標準コマンドを組み込みました。さらに、イースターエッグも時々出現するので、すべて試してみてください。

  • 電話をかける:「お母さんに電話して」。
  • 電話を切る:「電話を切ってください。」
  • メッセージを送信します: 「スティーブにメッセージを送信」または「お父さんに鍵はどこにあるのか聞いてください」
  • 前のメッセージを読み戻す:「前のメッセージを読み戻す」。
  • 道順を取得: 「家までの道順を取得」
  • 音楽を再生します: 「好きな音楽を再生して」または「ヴァンス ジョイの「ジョージア」を再生して」
  • 音楽を停止: 「再生を停止」または「別の曲を再生」。
  • 近くのデバイスに ping を送信します。「私の iPhone はどこですか」。
  • タイマーを設定します:「タイマーを 10 分に設定します」。複数のタイマーに「ヌードル タイマーを 8 分に設定します」という名前を付けて設定します。
  • タイマーを確認します。「タイマーの残り時間はどれくらいですか?」
  • アラームを停止します: 「停止」または「アラームを停止」するか、デバイスがアラームを鳴らしており、Apple Home に属している場合はその人の名前を追加します。
  • HomeKit デバイスを制御する: 照明をオンにしたい部屋の HomePod にコマンドを送信するときに、「照明をオンにしてください」。または、「階下の照明をオンにして」ゾーンを提供します。
  • リマインダーを設定: Safari などのアプリで見ているものに対して「これを思い出させる」。または「家に帰ったらゴミを出すようにリマインドして」
  • カメラ アプリで写真を撮ります: 「写真を撮る」または「自撮りを撮る」。
  • メディアの再生: 「『テッド ラッソ』の次のエピソードを再生する」または「リビング ルームで『先史時代の惑星』の再生を開始する」。
  • 情報を求める: 一般的なクエリを Siri に投げることができ、結果はさまざまです。 「『シンデレラ』っていつ出たの?」 「『スーパーマリオブラザーズ ザ・ムービー』の次の上映はいつですか?」「イースターは何の日ですか?」または「レッドソックスのスコアは何ですか?」
  • カレンダー イベントの作成: 「4 月 14 日の午後 3 時に医師の予約をするカレンダー イベントを作成します」
  • 計算と偶然: 「4,400 を 3 で割った数は何ですか?」または「コインを投げる」、「サイコロを1つ振る」、または「サイコロを2つ振る」。
  • Shazam を起動します: 「これは何の曲ですか?」

Siri は、iPhone にインストールされているほぼすべてのアプリにアクセスできます。 [設定] の [Siri と検索] メニューを開いて、各アプリが Siri および Spotlight とどのように連携するかを確認します。

パーソナライゼーション

さまざまな Apple 製品で Siri を使用すると、スマート アシスタントは学習した内容を使用してさらにパーソナライズされます。本質的に、各ユーザーの Siri はそのユーザーに固有のものです。

Siri をさらにカスタマイズするために複数の音声から選択することもできます。アメリカ人の声は 5 つから選択でき、より良いインクルージョンを提供するために性別ではなく番号で識別されます。 Apple はオーストラリア語、イギリス語、インド語、アイルランド語、南アフリカ語でも音声を提供しています。

性別を持たない複数の音声オプションを使用して Siri をセットアップする

デバイス全体で表示される提案の他に、ショートカットと呼ばれるカスタム アクションを作成することもできます。 iOS 13 以降、ショートカットがシステムに組み込まれているため、一般ユーザーでも携帯電話を使って簡単に操作できるようになります。 Siri Intelligence と音声アシスタントの両方がこれに貢献します。

さらにカスタマイズは、Apple アプリ内または音声アシスタント自体内で行うことができます。 Siri に、どの連絡先が家族なのか、特定の名前や単語の綴りと発音を伝え、会話で使用するニックネームを設定することができます。

「Siri、私のアップデートは何ですか?」と尋ねてみてください。これにより、天気や今後のカレンダーイベントをパーソナライズして読み上げたり、NPR、Fox、Apple News の間で設定できる短いニュース ポッドキャストを再生したりすることもできます。

プライバシーとセキュリティ

Apple のあらゆる事業と同様に、同社はプライバシーとセキュリティを念頭に置いて Siri とそのシステムを構築しました。で見つかったセキュアエレメントアップルシリコン暗号化された個人データをデバイスに保存します。複雑なアクションや質問のみをサーバーに送信し、ランダムな識別子を使用して解析します。

設定から、いつでもこの識別子とすべての個人設定およびデータを削除およびリセットできます。

Siri を使用してテキストおよび音声メッセージを送信する

現在iOS14、すべてのテキスト読み上げ認識は、ニューラル エンジンを使用してデバイス上で行われます。これは、ディクテーションなどの機能が、処理のためにサーバーに送信されることなくローカルで実行されることを意味します。

Apple による音声データの使用方法については懸念があったため、同社はユーザーが特定の診断ツールをオフにする機能を導入しました。以前は、精度分析のために録音が Apple に送信されていましたが、現在はオプトインのみの機能となり、代わりにインタラクションの文字起こしが使用されます。

Apple は Siri のプライバシーをさらに強化しましたアップルウォッチシリーズ9S9 SiP を搭載した Apple Watch Ultra 2。ユーザーの iPhone またはインターネットに ping を送信せずにコマンドを処理できる場合は、処理されます。

Apple TV のオンデバイス Siri

Apple はサーバーに依存してクエリを処理するのではなく、Apple TV 自体に Siri 処理をさらに導入すると WWDC 2024 で発表しました。

ユーザーにとって、これにより基本的なクエリに対する応答が迅速化される可能性があります。また、インターネットを経由してサーバーに戻ってくるのではなく、一部のクエリをローカルで処理し続けるだけで、プライバシーとセキュリティの向上にも役立ちます。

ショートカット

ショートカットはワークフローの次の段階であり、サードパーティ製です。iOS利用可能な API を使用してユーザーがオンデバイス オートメーションを作成できるようにするアプリ。 Apple はショートカットの基礎を築くために Workflow を購入しました。

ショートカットは色とフォルダを使用して整理できます

当初、Apple は手動で制御するショートカットと音声で起動する「Siri ショートカット」を区別していました。 3 番目のカテゴリのショートカットも、サードパーティ アプリによって提案されたショートカットに使用されました。

その後、混乱を減らすために、さまざまな種類のショートカットが 1 つの形式に統合されました。これで、ショートカット名をコマンドとして言うことで、Siri 経由ですべてのショートカットを使用できるようになります。

Apple は、iOS 14 でショートカットのいくつかの側面を更新しました。オートメーションはユーザーの操作なしで実行でき、ホーム画面に配置されたショートカットではショートカット アプリが起動しなくなり、ショートカット アプリにはショートカットを並べ替えるためのフォルダーが追加されました。

ダイナミックアイランドiPhone14プロショートカット アラートを表示して邪魔にならないようにします。そのため、ユーザーはショートカットの自動化が中断されることなく実行されるのを確認できるようになりました。

開発者は、ショートカット アプリ内から直接ショートカットを提案するための改良されたシステムも備えています。

翻訳する

翻訳するiOS 14 のアプリを使用すると、Siri が会話をリアルタイムで翻訳できるようになります。アプリは話者が使用している言語をインテリジェントに理解し、その場で翻訳します。

翻訳はテキストの翻訳や会話に使用できます

横向きモードで持つと、Translate は画面の両側に両方の言語で会話を表示するため、各人が翻訳を簡単に確認できます。

翻訳アプリは完全にオフラインで動作し、次の言語の双方向翻訳を備えています。

  • 英語
  • 北京語
  • フランス語
  • ドイツ語
  • スペイン語
  • イタリア語
  • 日本語
  • 韓国人
  • アラビア語
  • ポルトガル語
  • ロシア

Siriを搭載したデバイス

Siri が独占的に発売されましたiPhoneiPhone 4sから搭載された機能です。それ以来、この機能は Apple エコシステムのあらゆる部分に広がりました。次の例は、Siri の場所とユーザーが Siri を実装する方法を示しています。

iPhone、iPad、iPod touch

「Hey Siri」、または iOS 17 では単に「Siri」と言うと、最新の Apple デバイスが起動し、クエリのリッスンが開始されます。ホームボタンを長押しすることでSiriを呼び出すこともできます。タッチIDデバイスまたはサイドボタン顔認証デバイス。

iPhoneあなたの声だけを聞くことを学習できるため、コマーシャルや他のユーザーによる誤ったアクティベーションが減少します。

アップルウォッチ

ユーザーの場合アップルウォッチ画面が完全にオンになった状態で起きている場合、スリープ解除コマンドを話すと時計の Siri が起動します。

Apple Watchには専用のSiriウォッチフェイスがあります

Appleのウェアラブルには「Raise to Speak」と呼ばれる機能も含まれている。これにより、ウェイク フレーズを言わずに時計を口元に上げてコマンドを話すことができます。この機能が最初に登場したのは、アップルウォッチシリーズ3

Digital Crown を保持すると、アシスタントも呼び出されます。これは、ウェイク ワードや手のジェスチャーを使用せずに Siri の注意を引く確実な方法です。不注意によるアクティベーションが頻繁に行われる場合、ユーザーはこの方法を無効にすることができます。

Apple Watchには専用のSiriウォッチフェイスもありますが、Appleは発売以来あまりアップデートしていません。それはまだ存在しますウォッチOS 10ですが、その機能のほとんどはウィジェット スタックに移動されました。

S9 SiP 以降を搭載した Apple Watch は、オフライン Siri コマンドにアクセスできます。

AirPods と Beats Pro

二代目AirPodsAirPods ProAirPods MaxPowerbeats Pro および Solo Proすべてが「Hey Siri」機能を提供します。第一世代の Airpods は、ダブルタップのジェスチャーで Siri を呼び出すことができます。

「Hey」のない新しい「Siri」コマンドは、次の場合にのみ機能します。AirPods Pro 2

H1 プロセッサ以降を搭載したデバイスは、「Siri によるメッセージのアナウンス」を使用して受信メッセージを読み上げます。ユーザーはウェイクワードを言わずにこれらのメッセージに返信できます。

Siri が何らかの種類のヘッドフォンで使用される場合、Siri は接続されている iPhone によって制御されます。iPad統合されたヘッドフォンベースの Siri に依存するのではなく。

ヘッドフォン、ヘッドセット、CarPlay

Bluetooth、Lightning ケーブル、またはオーディオ ジャックを介して接続されたマイクを内蔵した一部のデバイスは、Siri で動作します。互換性のあるデバイスでは、再生/一時停止ボタンまたは通話ボタンを押し続けると、Apple アシスタントを呼び出すことができます。

ハンズフリーの Siri と CarPlay により、道路から目を離すことができません

カープレイ機能は車のハードウェアによって異なります。通常は、「Hey Siri」と呼びかけたり、タッチスクリーンのホームボタンやステアリングホイールの呼び出しボタンを長押しすることでアシスタントを呼び出すことができる。

車内でアシスタントを使用すると、電話をかけたり道順を調べたりするなど、安全なハンズフリー制御が可能になります。 CarPlay を介したインタラクションでは、インタラクションが音声のみに制限されるため、ドライバーの気が散ることはありません。

アップルTV

Siri のアップルTV機能が制限されています。 Apple TV でアシスタントを使用するには、Siri ボタンを押し続けます。Siriリモート。映画や音楽の再生をリクエストしたり、ユニバーサル検索を使用して映画を検索したり、トリビアの質問をしたり、家を制御したりできます。メディアを表示するときに、「この映画に誰が出演しているか」または「彼らが何を言ったか」を尋ねると、Apple TV 用に設計された特定の結果が得られます。

HomePod と HomePod mini

Siri は HomePod の主要なユーザー インターフェイスです。 「Hey Siri」でアシスタントを呼び出すか、HomePod 上部のガラス面を長押しすることでアシスタントを呼び出すことができます。

「Hey」を省略した「Siri」コマンドは、第 2 世代 HomePod および HomePod mini で機能します。

Apple は HomePod の Siri を個人の音楽エキスパートと呼び、HomePod に固有のその他の機能を提供します。これらには、アーティストについて尋ねられたときにページの結果を表示するのではなく、アーティストが誰であるかを説明することが含まれます。

マック

の上マック、専用の Siri ボタンを使用して Siri を起動できます。これは、次の場所で見つけることができます。タッチバーTouch Bar またはメニュー バーを備えた MacBook 上で。キーボード ショートカットを使用してアシスタントを起動することもできます。

「Hey Siri」は、2018 年以降に製造された内蔵マイクと T2 チップを搭載した Mac で動作します。このバージョンも制限されており、制御できるようになったのはつい最近です。ホームキット。 「Hey」のドロップは、Apple Silicon を実行している Mac でのみ機能しますmacOS ソノマ

Siri はあらゆるものに存在しますiOSデバイスやほぼすべての Mac で使用できるため、アシスタントは多くのユーザーにとって主要な情報源となっています。 Apple は、何百万ものユーザーが毎日 Siri をアクティブにしていると主張しており、同社は Siri を関連性と学習性を維持したいと考えています。

Siri はコンピューター アルゴリズムであるため、Apple は音声の選択から性別を削除しました

Apple は重要な国家的行事や社会運動の際に声明を発表する傾向があり、Siri テクノロジーも同様に参加することがあります。選挙やテロ行為などの大規模なイベントにより、Apple は特別な Siri クエリを追加するようになりました。このような状況において、同社は単に Wikipedia ページを表示するだけでなく、一般の人々に情報を提供したいと考えています。

2020年、Appleは選挙を巡る出来事についてSiriをより賢く認識させ、各州の予備選挙や党員集会に関する有益な情報をユーザーに提供した。アシスタントは、回答を読み上げて、Apple News の特別報道へのリンクを表示することがよくありました。

2020 年に前例のない出来事が進む中、Apple はデジタル アシスタントをそれに応じて適応させました。の広がりコロナウイルス恐怖と疑念を呼び起こし、アップルは再びスマートアシスタントを便利なツールにしたいと考えた。 AppleはSiriに新型コロナウイルス感染症に関する質問に対する具体的な回答を提供し、CDCへのリンクと検査センターへの地図による道順を提供した。

ジョージ・フロイドさんの抗議活動が勃発したとき、事実確認された情報を求める声も高まった。誤った情報が広がる中、Apple は人々を事実と適切な文脈に誘導するために Siri にアップデートを提供しました。ユーザーが「All Lives Matter」について尋ねると、Siri はユーザーに Black Lives Matter ページへのリンクを表示して応答します。

Apple は、iOS 14.5 のベータ版で Siri をアップデートし、新しい英語音声を追加しましたが、より重要なのは、このアップデートにより音声から性別識別情報が削除されたことです。ユーザーには、デフォルトで特定の音声サウンドを選択するのではなく、セットアップ時に選択肢も与えられます。これらの発表は、国際トランスジェンダー・ビジビリティ・デーに行われた。

iOS 15.4 では、英語を話す Siri に性別のない音声が追加されます。

Siriの未来

Appleは、代替デバイスの準備が整わないまま、初代HomePodを2021年に販売中止しました。 Appleがスマートアシスタント競争から撤退し、スマートスピーカー市場を完全に放棄するのではないかと懸念する人もいた。

しかし、Apple は 2023 年 1 月に新しい大型 HomePod を発表しました。Amazon などの他の企業がスマート アシスタントへの取り組みを縮小しているにもかかわらず、Apple は新しいハードウェアの導入に力を入れています。

音声認識と処理の全般的な改善以外に、Apple は iOS 14 以降、スマート アシスタントに多くの新機能を導入していません。オフライン コマンドは、iOS15、 そしてiOS16ショートカットアクションが改善されました。

噂では、Siri をよりスマートにするためのソリューションとして、ChatGPT や Google Gemini などの大規模言語モデルが指摘されています。 Appleはチャットボットを導入する予定はないが、この技術を利用して自然言語処理を強化する可能性がある。