Appleは月曜日、Machine Learning Journalの最新エントリーを公開し、iPhoneやiPadなどのデバイス向けの「Hey Siri」ウェイクワードのニュアンスをさらに説明した。
重要な概念の 1 つは、エントリーそれは「話者認識」です。 Apple デバイスは、メイン ユーザーが「Hey Siri」と言ったときにのみ起動するように設計されており、「偽者受け入れ」と「誤拒否」率を最小限に抑えることができます。後者は、デバイスがコマンドに対してウェイクアップしないケースを指します。
AI アシスタントを設定するときに「Hey Siri」というフレーズを数回繰り返すように求められるのは、話者認識のためです。ただし、このアプローチの問題は、通常、人々が同じ周囲雑音の中でそのフレーズを繰り返すことです。Apple が実際の使用中に追加の録音を収集するのはこのためです。ただし、同社は、初期の段階でこれらの録音を多用しすぎて、システムを台無しにすることを避ける必要があります。オリジナルトレーニング。
おそらく、Siriの将来のバージョンでは、ユーザーが明示的な「ウェイクワード」トレーニングをスキップし、最初から「Hey Siri」を使用できるようになる可能性があるとSiriチームは書いている。同グループは現在もエコーやノイズの影響への対処に取り組んでおり、さまざまな種類のそのような効果をトレーニングデータに追加することにある程度の成功を収めていると述べた。
Apple は、Siri の改善に向けて競争していると考えられています。Googleのジョン・ジャナンドレア氏を引き抜く機械学習と AI の取り組みを主導します。 Google アシスタントは、市場で最高の AI アシスタントであると考えられており、Google の総合的なリソースを活用して、さまざまなクエリを理解し、答えることができます。
~に対する主な批判ホームポッド, Apple初のスマートスピーカーは、Siriへの依存度が高く、通常はランク付けされています。Google アシスタントと Amazon Alexa の両方の下にある— アシスタントの関連スピーカーの有利なスタートと人気を考えると、深刻な問題です。たとえば、Siri でのサードパーティ アプリのサポートは面倒だったり、存在しなかったりする場合がありますが、Amazon Echo のような製品はすぐに多くのオプションをサポートします。
Apple の Machine Learning Journal は 2017 年 7 月に創刊され、次のような記事が掲載されました。照合された画像によるニューラルネットトレーニング。
このサイトは、研究者が発見したものを公開し、研究内容を学界全体と議論できるようにするというアップルの約束の一環とみられる。 Appleの方針の大転換が発表されたApple 人工知能研究ディレクターによるラス・サラハトディノフ。
Apple は歴史的に、人工知能の分野で優秀な人材を採用するのが難しいと感じてきました。研究者が発見を共有することを妨げる、会社の消費者のプライバシーポリシー製品開発の妨げとなることが研究者に問題を引き起こしています。
Apple は Siri を超えて、人工知能と機械学習の他の分野にも手を広げているようです。 2016年8月のインタビューで、Apple CEOのティム・クックはAIをAppleの技術の1つと呼んだ。未来を担うコア技術、テクノロジーに対するクックのビジョンを実現するには、ジャナンドレアの雇用が重要であると思われます。