Spring Updateなる発表があったのでざっとまとめました。
GPT-4o (omni オムニ) APIを発表
対GPT-4Turbo:
・2倍高速
・半額
・5倍まで利用できるようRateLimit緩和
(以前からざわついていたgpt2-chatbotがGPT-4o)
(Claude Opusベンチマーク超え)
音声の実装(Text-To-Speech)
・応対スピードの向上
・感情表現の実装(感情こもりすぎw)
・歌唱の実装(歌も歌えるんかい)
・対話の空白を埋める相槌の実装
視覚の実装(Vision)
・動画をリアルタイムでみて即座に理解し音声で回答
・動画を見ながら数学を解く手伝いまで
プログラムの実装支援
・コピペしてシームレスにコードの共有から
コーディング補助(音声対応)
・自分のデスクトップをリアルタイムで共有て
見せながら説明(Visionの延長と思われる)
(一緒に線形代数方程式を読解)
リアルタイム翻訳(ついに来た🔥)
・英語、イタリア語など。
入ってきた言葉に応じて臨機応変に。
もう、翻訳こんにゃく。
人物理解
・ビデオ通話のリアルタイムの会話相手。
人物のリアルタイムのビデオを見て、
会話が成立している。
どんなスタイルか等相談相手にすら。
無料ユーザーへ機能開放 (そのうち)
Web検索、データ分析、画像応答、
ファイルアップ、GPTs、メモリー機能
無料ユーザーは回数制限
※ちなみにデモのために、
NvidiaがGPUを提供してくれたとのこと。
いずれも音声が効いている。
「アシスタント」という言葉がまさにふさわしい。
この記事へのコメントはありません。