Appleは今年後半に、多くのデバイスでリアルタイムの音声文字起こしと要約をシステム全体で利用できるようにしたいと考えており、iPhoneメーカーはいくつかのコアアプリケーションの効率向上にAIの力を活用しようとしていることがAppleInsiderでわかった。
この件に詳しい関係者によると、Apple はいくつかの次世代オペレーティング システムで、AI を活用した要約と音声転写の大幅な強化に取り組んでいるとのことです。この新機能により、同社の定番アプリであるメモ、ボイスメモ、その他のアプリのユーザーの効率が大幅に向上すると期待されています。
Apple は現在、iOS182024 年後半には、対応するアプリにも導入される予定です。macOS 15そしてiPadOS18も。
Apple がデバイス ポートフォリオ全体に含めるデフォルトのボイス メモ アプリケーションは、アップグレードされた機能を最初に受け取るアプリケーションの 1 つとなります。アプリの初期バージョンでは、各音声録音の実行中のトランスクリプトが提供され、同社の最近のライブ ボイスメール機能と同様に動作します。
文字起こしはアプリケーション ウィンドウの中央領域を占め、アプリの既存のバージョンにある録音された音声の大きなグラフィック表現を置き換えます。
文字起こしも次のバージョンの Notes に取り込まれる予定です。このソフトウェアに詳しい関係者によると、両アプリのプレリリース版には吹き出しの形をした専用の文字起こしボタンが搭載されているという。新しい吹き出しをタップすると、アプリ内で録音された音声の文字起こしが表示されます。
iOS 18 の Notes でのボイスメモの文字起こしのレンディション
文字起こしツールは、Notes の今後の音声録音機能と連携して、新しいコンテキストを提供します。最初に詳しく説明されましたによるAppleInsider4月に。具体的には、このアップデートでは、主要な焦点とアクション項目の基本的なテキストの概要を即座に提供する、録音された音声の AI 生成の要約のオプションが追加されます。
AI 要約機能は、新しいアプリ内音声録音およびリアルタイム文字起こしオプションと組み合わせることで、Apple の組み込みメモ アプリを真の強力なものにすることが期待されています。この 3 つの機能は、主要な焦点に至るまで大量のデータを処理するという重労働を引き受け、幅広い実用的なアプリケーションに利益をもたらします。これはすべて、ユーザーにとって一目でわかる利便性と明確さになります。
学生はサードパーティのツールに頼ることなく、講義や授業を簡単に記録できるようになります。新しいメモ アプリから記録する場合は、画像、リンク、表などのデータ構造などの他のメディアと一緒に、メモ内に書き起こしと要約を含めるオプションがあります。
この機能は、業務の一環として電話会議、仮想ビジネス会議、セミナーに定期的に参加する専門家にとっても有益です。このようなイベントでは、多くの場合、大量の情報、さまざまな統計、詳細な事業計画、日付、スケジュールが漏洩し、Apple の AI テクノロジーがこれらを分析し、適切に構成された要約概要に再編成します。
同じことは、定義、複雑なアイデアや理論原理の説明、具体的な例など、さまざまな情報が頻繁に含まれる、より高度なレベルのクラスや講義にも当てはまります。
一方、ジャーナリストは、長いインタビューを文字に起こし、要約する非常に効率的な方法を得ることができます。著者や脚本家などのクリエイターは、主要なデータ ポイントを分離するためだけに録音の大部分を再生して聞く必要がなく、重要なアイデアを簡単に記録し、後で確認することができます。
Apple は、文字起こしおよび要約機能が正確な結果を生成するよう多大な努力を払っていますが、間違いは避けられません。したがって、元の音声をトランスクリプトおよび AI によって生成された要約とともに維持することで、トランスクリプションまたは要約のプロセスでソース情報が失われることはありません。
新しい文字起こしと要約機能は、Appleが今年推進する広範なAI推進の一環となる。同様の要約機能も Safari 18 に搭載される予定ですインテリジェントブラウジング経由、そして組み込みのメッセージ アプリへ — Apple との統合を通じてオンデバイス AI ソフトウェア。
Safari とメッセージの AI を利用した要約機能のユースケースと全体的な目的はまったく異なります。 Notes では会議、電話会議、講義を要約するオプションがユーザーに提供されるのに対し、Safari では Web ページの要約が可能で、メッセージではメッセージ内容の要約版が提供されます。
特定のAI機能は完全にデバイス上で機能すると予想されるため、AppleのAIソフトウェアはユーザーのプライバシーを保護する役割も果たす可能性がある。ただし、音声文字起こしや高度なAI要約の場合は、当面はサーバー側での処理が必要になる可能性があります。
同社は、要約と音声転写をシステム アプリケーションに組み込むことで、現実世界のシナリオに取り組むために AI を導入するユースケースにおける最も優れた利点のいくつかを実証しようとしています。 Apple の AI への取り組みの目標は、顧客が日常業務をより効率的に実行し、成功できるようにすることを約束する開発者向け機能を提供することです。
同時に同社は、現在 AI テクノロジーを利用している競合他社のアプリケーションの急増に対して、自社の立場をより良くしたいと考えており、そのうちのいくつかは、消費者が AI をデジタル ライフに組み込んでおり、健全な普及率を示しています。
のカワウソアプリケーションたとえば、Apple の Editors' Choice Award のもう 1 つの受賞者です。この記事で説明した機能と同様の機能を提供します。これを使用すると、ユーザーは生成 AI を介して会議を記録、文字起こし、要約することがすべて 1 つのアプリで可能になります。
Microsoft の OneNote は、ボイス ノートの形式での音声録音のサポートも提供しており、Apple のメモおよびボイス メモ アプリケーションのもう 1 つの潜在的なライバルとして機能します。
ただし、Apple がソフトウェアのプレリリース ビルドでテストしたすべてのソフトウェア機能が既存のリリース サイクルに組み込まれるわけではないことを強調する価値があります。 Apple は土壇場でプロジェクトをキャンセルしたり、後続のオペレーティング システム リリースやアプリの機能を遅らせたりすることが知られているため、最終的にはタイミングや可用性についての保証はありません。
とはいえ、新しい AI 要約機能とリアルタイム文字起こし機能は、Apple の世界開発者会議で予定されている Apple の次世代オペレーティング システムとともに発表される予定の軌道にまだ乗っているようです (WWDC)6月に。彼らに加わる予定なのは、改善されたカレンダーそして電卓アプリ、とりわけ。