【ledge.ai】ChatGPTに視覚・聴覚・音声出力を実装画像を認識して音声対話が可能/2023/10/2

【ledge.ai】

2023/10/2

米国OpenAIは現地時間の2023年9月25日、対話型AI「ChatGPT」に、ChatGPTに新たな音声と画像機能を導入開始すると発表した。ChatGPTとの音声対話や、画像を示し対話することができる。例えば冷蔵庫の写真を撮り、夕食のメニューを考えさせることも可能だという。音声はiOSとAndroidで利用可能となり、画像はすべてのプラットフォームで利用できる。この新機能は、今後2週間でPlusユーザーとEnterpriseユーザーに順次提供される。

例えば下図のように、自転車の一部を撮影した画像と文章で「これはレバーですか？」とChatGPTに質問をすると、「いいえ、それはボルトです。緩めるにはレンチが必要です」という回答が返ってくる。

音声機能には、新しいテキスト読み上げモデルを活用しており、テキストと数秒のサンプル音声だけから人間のような音声を生成できる。プロの声優と協力して数種類の音声が作成されている。また、音声認識には同社のオープンソースのWhisperを使用し、話された言葉をテキストに変換する。

画像理解は、マルチモーダルGPT-3.5およびGPT-4によって強化されている。これらのモデルは、言語推論スキルを、写真、スクリーンショット、テキストと画像の両方を含むドキュメントなど、幅広い画像に適用するという。

投稿者: okazaki-N
ニュース一覧, ◆科学・技術

全国瞬時警報システムの情報伝達試験の実施について/20…前の記事

【visualcap.】脱ドル化: 米ドルに代わる通貨…次の記事

福山市議会議員岡崎まさずみ

ニュース

【ledge.ai】ChatGPTに視覚・聴覚・音声出力を実装画像を認識して音声対話が可能/2023/10/2

【ledge.ai】

ニュース関連記事

鞆の浦歴史民俗資料館/演能・水野家ゆかりの名舞台に舞う/2022年1…

【cookpad】最後のひと絞りに苦労しない！マヨネーズの使い切りワ…

ふくやま子育て応援センターの催し/2022年10月1日更新

福山城400年博-FUKUYAMA CASTLE EXPO 2022…

良い高校生がいるもんだなぁ☺️　素晴らし…

備中備後デニムコンテスト２０２０受賞作品決定

サイト内検索〈下記欄へ入力〉

ニュース > 2011/9～月別アーカイブ

ニュース > カテゴリメニュー

【 FBでフォロー！】

誠友会

リンク一覧

岡崎まさずみ Official Web Site | みんなでつくろう福山の未来！

facebook

ニュース

【ledge.ai】ChatGPTに視覚・聴覚・音声出力を実装 画像を認識して音声対話が可能/2023/10/2

ニュース関連記事

サイト内検索〈下記欄へ入力〉

ニュース > 2011/9～月別アーカイブ

ニュース > カテゴリメニュー

【 FBでフォロー！ 】

誠友会

リンク一覧

facebook

【ledge.ai】ChatGPTに視覚・聴覚・音声出力を実装画像を認識して音声対話が可能/2023/10/2

【 FBでフォロー！】