クリエイティブソフトウェアメーカーのAdobeは、将来的には音声コマンドだけで写真が編集できるようになるかもしれないと期待しており、iPad上のSiriのようなデジタルアシスタントを使って画像を変更する様子を示す新しい概念実証ビデオを披露している。

このビデオは、ユーザーが iPad で画像を表示し、マイクのアイコンをタップしてデジタル アシスタントを起動するところから始まります。アプリは音声だけで写真に変更を加え、画像を正方形にトリミングし、反転して反転し、画像に加えられる変更を確認し、結果を Facebook に投稿します。

口頭コマンドの大部分は、「この写真を再フレームしたいのですが」やトリミングのために「正方形にします」などの自然言語構造を使用していました。各コマンドに続いて、アシスタントは音声で話し、実行する各アクションを確認し、音声指示をどのように解釈するかをアドバイスします。

このビデオのメモには、Adobe Research チームのシステムが「オンデバイス コンピューティングを介してローカルで、またはクラウドベースの自然言語理解サービスを介して」口頭コマンドを受け入れて解釈できることが記載されています。

概念実証ビデオでのデモンストレーションにもかかわらず、Adobe は、ユーザーがこのようなアシスタントを活用できるようになるまでには長い時間がかかることを認めました。

「これは、クリエイティブな顧客がAdobeモバイルアプリケーションを使用して簡単かつ魅力的な方法で画像を検索および編集できるようにする、堅牢なマルチモーダル音声ベースのインターフェースに向けた当社の最初のステップです」と同社は述べた。

アドビはしばらくの間、Adobe Cloud Platform への機械学習と AI の導入に取り組んできました。11月に発表タスクを自動化し、追加の支援を提供するフレームワークを導入しているとのこと。 Adobe Teacher と名付けられたこのサービスは、Photoshop の Liquiify ツールを「顔認識」にするだけでなく、ストック ビジュアル検索やフォントの一致などを支援します。

一方、Appleは音声駆動型パーソナルアシスタントSiriをサードパーティ開発者に開放した。去年iOS 10 のリリースにより、iPhone と iPad における Adob​​e のコンセプトへの道が開かれる可能性があります。