視覚インテリジェンスが最も強力な場合がありますApple Intelligence特徴。それが何であるか、それがどのように機能するか、そして私たちはいくつかの異なる現実世界の例を経験します。
AppleはiOS18.2で視覚インテリジェンスを追加しました、そしてあなたはiPhone 16またはiPhone 16 Proを使用して使用します。ごめん、iPhone 15 Proユーザー。
Apple Intelligenceの機能の傘下に提出されています。これは、iPhone 16ファミリー専用の数少ないApple Intelligence機能の1つです。
このAI機能は、カメラを使用しますiPhone環境をスキャンし、情報を提供します。それが少し抽象的な感じであれば、心配しないでください、私たちはあなたにスタジオの内外でたくさんのデモを見せようとしています。
視覚インテリジェンスの使用方法
ビジュアルインテリジェンスを有効にするために、iPhoneの右下側のカメラコントロールを押し続けます。これは、カメラアプリを開く短いプレスに匹敵します。
カメラが洗練されたカラフルなアニメーションで開くと、携帯電話が振動します。 「Ask」ボタン、「検索」ボタン、および中央にキャプチャボタンを備えたカメラのライブフィードを表示する新しいインターフェイスが表示されます。
最も基本的な用途から始めましょう。視覚知能を開き、何かを指して、スナップします。
視覚インテリジェンスは、コードを識別するのに役立ちます
その後、ChatGptから自分が見ているものについて情報を入手するか、Google画像検索を行い、詳細を確認できます。
たとえば、スタジオにあるこれらすべての異なるケーブルの写真を撮ることができます。毎回、視覚インテリジェンスは、それらがどのものであるかを特定し、それらに関するいくつかの基本的な情報を提供することができます。
あなたがスキャンしたケーブルの詳細については、フォローアップの質問をすることもできます
あなたがあまり知らないケーブルを横切って発生した場合は、詳細についてはフォローアップの質問をすることができます。 DisplayPortケーブルができることのこの詳細な内訳のように。
また、この古いゲームボーイカラーが横たわっています。視覚インテリジェンスを使用したクイックスキャンで、リリースされた年は何年か尋ねることができます。
どちらもChatGptを介してあなたに情報を入手します。または、画像検索を使用できます。
デュアルセンスコントローラーをスキャンした後、購入する場所について結果が得られました
PlayStation 5 DualSenseコントローラーをスキャンしたとき、この特定のカラーウェイを見ることができました。その後、Walmartアプリに飛び込んで購入できます。
テキストで視覚インテリジェンスを使用します
質問や写真の検索以外では、テキストや数字にも役立ちます。
ビジュアルインテリジェンスは、テキストを声に出して要約または読み取ります
テキストのブロックでそれを指すと、コンテキストが認識している新しいボタンが表示されます。 AIサマリーを生成するか、電話を声に出して読んでもらうことができます。
旅行中、別の言語でテキストを検出すると、翻訳ボタンが表示されます。タップすると、写真をスナップし、画像上のテキストをデフォルト言語に置き換えます。
レストランのメニューを英語に翻訳します
スペインのレストランメニューを翻訳してテストしました。他のアプリを使用する必要がなく、自動的に機能したため、それは素晴らしいことです。
最後に、テキストと数字が方程式を解くことです。私たちがまだ学校にいたとき、素晴らしいものでした。
視覚インテリジェンスは、数学の問題を段階的な結果で解決できます
入力する必要さえありません - 視覚インテリジェンスでスキャンして、あなたのために解決するように依頼してください。例の方程式では、私たちのためのすべての異なるステップを壊しました。
食品のスキャン
それは完全に具体的ではありませんでしたが、視覚知性はあなたの食べ物からマクロを集めるのにも役立ちました。他のデモのように、私たちはそれを私たちのプレートに向けて、それを食べ物を識別し、私たちが食べているもののために私たちにラフな範囲を与えました。
それはただの大まかな推定ですが、視覚知能は私たちのポップコーンに関する栄養情報を与えてくれました
私たちは少数のポップコーンを持っていたので、視覚知能にそれがいくつのカロリーであるかを尋ねました。それは、タイプとそれがどのように調理されたかに基づいて、カロリーの範囲があるようなほんの一握りを私たちに伝えていました。
その範囲をポップコーン(SmartPop、Air Popped、映画館スタイルなど)と知っていることと組み合わせると、実際の価値のまともなアイデアを得ることができます。
より正確にすれば、炭水化物のカウントは膨大です
同様に、艶をかけられたドーナツの写真を撮り、それが含まれている炭水化物の数を尋ねました。もう一度、それは私たちに可能な炭水化物の範囲を与えてくれました。
このような機能は、特定のユーザーにとって重要です。新たに診断された1型糖尿病患者のように、通常は子供であり、炭水化物のカウントではまだ偉大ではないかもしれません。
AIモデルが改善するにつれて、これがより正確になることを願っています。
植物や動物の識別
iOS 18.3を使用して、Appleは視覚インテリジェンスにいくつかの新しい機能を追加しました。視覚インテリジェンスは、植物や動物を自動的に識別できるようになりました。
視覚インテリジェンスでキッチンの観葉植物を識別します
キッチンの植物にそれを向けたとき、それが認識されるとすぐに植物の名前で泡が上部に現れました。バブルをタップすると、ウィキペディアからの追加情報が表示されます。
もちろん、犬を飼っている場合はもちろん、動物も扱っていますが、純粋な繁殖を幾分持っている必要があります。写真だけに基づいて、犬の血統を正確に推測することはできません。
私たちの犬は純粋なフラットコートレトリバーではありませんが、そこにいくつかの混合がある可能性があります
私たちの子犬、ブルックリンは、フラットコートレトリバーとラベル付けされました。彼女は彼女にレトリーバーを持っているかもしれませんが、彼女は決して純血種のフラットコートではありません。
他のより一般的な動物は、これに適している可能性があります。または少なくとも一般的な識別。
予定のスケジュール
また、iOS 18.3に来ることは、予定のスケジュールでした。これは、マーキーサイン、ポスター、または手書きのメモからすべてで機能します。
ニューヨークにいる間、劇場の正面をスキャンして、カレンダーにショーの初日を追加することができました。家に戻ったら、冷蔵庫が投稿した日付の夜のメモをスキャンすることもできます。
デートの夜!視覚インテリジェンスですぐにカレンダーに追加されました
カレンダーの予定を保存する前に編集する機会があります。何よりも、カレンダーアプリで表示すると、ソース写真も参照用に添付されています。
レストランや企業
視覚知能のお気に入りの機能は、建物、企業、レストランでそれを使用することです。ビジネスに応じて、膨大な機能があります。
私たちがニューヨーク市に旅行している間、視覚知能はモニュメントを調べるのに便利でした
ランドマークは、視覚インテリジェンスで簡単に識別されます。あなたは彼らの名前、構築されたとき、そしてより有用な事実を見ることができます。
ビジネスを見た場合は、関連するすべてのビジネス情報を取得するために携帯電話を向けることができます。店の営業時間、ウェブサイト、電話番号などを表示できます。
視覚インテリジェンスを使用して、ビジネスに関する情報を取得します
レストランをスキャンすると、食べ物の写真を表示することができ、注文することができます。レストランが予約、オンラインフード注文などをサポートしていると仮定しています。
レストランは、時間、フードの写真、メニュー、レビュー、支払いオプションを表示したり、予約をスケジュールしたり注文したりすることもできます。
私たちは小さな町でそれをテストし、地元のコーヒーショップで時間を過ごすことができることがわかりました。
視覚インテリジェンスは良くなっているだけです
Apple Intelligenceは全体として少しゆっくりと展開されていますが、Appleはそれを明らかに信じています。視覚知能でここで見たように、ますます多くの機能が追加されています。
新しいボタンなどに少し慣れてみましたが、使用を開始すると非常に便利になります。
AppleがApple Intelligenceを繰り返し続けるにつれて、より多くのユースケースが出現する可能性があります。