Google と OpenAI は、AI モデルと機能の大幅なアップデートを発表し、Apple との競争が激化しています。WWDC。
月曜日、OpenAI は革新的な GPT-4o AI モデルとまったく新しいマック一方、Googleは火曜日にGeminiソフトウェアの大幅な改善をプレビューした。両社はさまざまな注目すべき機能を披露し、その結果、市場の競争がさらに激化しました。
Apple はその分野で大きく後れを取っているように見えるが、AIの取り組み、GoogleまたはOpenAIとの提携は、生成AI機能をユーザーベースに提供する簡単な方法であることが判明する可能性があります。少なくとも噂によるとそれがアップルが喜んで採る道だ。
OpenAI は最近、GPT-4o、同社の GPT AI モデルの新しいマルチモーダル バージョンで、さまざまな入力タイプを処理する強化された機能が含まれています。
以前のバージョンとは異なり、GPT-4o は 1 つのニューラル ネットワークを利用して音声、画像、テキストを処理できるようになり、結果として大幅な改善モデルが提供されます。製品発表では、速度と言語処理の向上も宣伝されました。
OpenAI の GPT-4o は感情を理解し、伝えることができるようになります。同社の最近のイベントでは、チームメンバーがモデルに顔の表情を分析し、ユーザーが表現している特定の感情を判断するよう依頼することで、これを実証しました。
OpenAI の ChatGPT が macOS で正式に利用可能になりました
音声形式で音声出力を提供する改良された音声モード機能により、GPT-4o は音声の調子を調整し、ユーザーの要求に応じてよりロボット的またはより自然な音声にすることができます。
同社はまた、打ち上げられたChatGPT の新しいデスクトップ アプリケーション。macOS、開発者向けの新しい API を導入しました。 GPT-4o は段階的な展開プロセスを通じてユーザーに提供されます。
Google の Gemini アップデート
Googleは、I/O開発者カンファレンスは火曜日、Gemini モデルに対する多数の機能強化を明らかにしました。新しく改良された Google Gemini は、より複雑なユーザー入力や画像を、その背後にあるコンテキストを考慮しながら理解できるようになります。
Google Gemini は生成 AI ツールです
この AI ソフトウェアは、新しいコンテキスト認識機能を備えており、PDF、ビデオ、または一連のテキスト メッセージなど、画面上のすべてを表示できることを意味します。 Gemini は情報を収集して出力を生成できますが、これは一部の Android デバイス上でのみ可能です。
たとえば、新しいCircle to Searchオプションを使用すると、ユーザーは画像内の個々のオブジェクトを選択し、そのオブジェクトに関するGoogle検索結果を即座に受け取ることができます。
Android のみで利用できるもう 1 つの機能は、Gemini Advanced を介して YouTube ビデオと PDF を分析するオプションをユーザーに提供します。有料サービスでは、ユーザーは具体的な質問をすることができ、動画やPDFの内容から回答が得られます。
Google の最新版 Gemini は、長い会話を要約し、文書、画像、ビデオから重要な情報を分離できるようになり、そのすべてがエンドユーザーにとって非常に有益となるはずです。 Apple は自社製品を通じて同様の機能を追求しています。
Apple の AI 戦略についてこれまでにわかっていること
Apple は、AI 製品に関しては競合他社に著しく遅れをとっていますが、その状況は、次の発表によってすぐに変わる可能性があります。iOS186月上旬に。
Apple は 1 年以上にわたり、として知られる社内の大規模言語モデル (LLM) に取り組んできました。アヤックス。同社は生成AIソフトウェアで、GoogleとOpenAIが5月初めに発表したものと同様の新機能を提供することを目指している。
最近の AI 推進の一環として、Apple は新しいオペレーティング システム全体に AI を活用したいくつかの機能を導入すると予想されています。ドキュメントとウェブページの分析、テキストの要約、画像キャプション、応答生成はすべて進行中です。
同社は、既存の一連のコア システム アプリケーションに生成 AI テクノロジーを組み込むことを目指しています。その結果、次のようなアプリが注意事項、サファリ、メッセージ、メール、シリおよび Spotlight Search はすべて、何らかの形で AI 対応の機能強化を受けることが期待されています。
Apple の Ajax LLM は Safari、Spotlight、メッセージを改善します
しかし、実際の機能という点では、Apple が達成できることには限界があります。のオンデバイスAIテスト中のモデルは、基本的なテキスト分析と基本的なデバイス上の応答生成のみが可能です。
より高度な機能にはクラウドベースの処理が必要になると思われるため、Apple は OpenAI とライセンス契約を締結しようとしていると伝えられています。これにより、Apple は自社のオンデバイス モデルでは実現できないさまざまな AI 関連の機能強化を提供できるようになります。
あ別の噂Apple は「」を作成したいと主張していますAI アプリストアこれにより、ユーザーは AI をテーマにしたアプリケーションや製品を他社から購入できるようになります。これにより、理論的には、Gemini Advanced などの製品の有料バージョンを使用するオプションがユーザーに与えられることになります。
Apple がそうであるように、私たちはすぐに Apple の AI への取り組みをより深く理解できるようになるでしょう。期待される6 月 10 日に開催される年次世界開発者会議で、新しい生成 AI 機能を発表します。