ChatGPT最新版に搭載された画像認識&生成機能
「ChatGPT」の登場から1年が経ち、世界中のさまざまな分野に大きな影響を与えています。最新版「GPT-4V」は従来のテキストベースから画像認識機能を搭載し、完全無欠な存在に近づきつつあります。さらには、新たに「DALL-E3」という画像生成機能を搭載。ChatGPTは最新版でどのように進化しているのかを見ていきましょう。
ChatGPT最新版にGPT-4Vがリリース
ChatGPTは、OpenAI社が2022年11月に公開した、人工知能チャットボット。人間のような自然な会話でさまざま生成AIのサービスを利用できるのが特長です。
現在、ChatGPTには無料で使える「GPT-3.5」と月額20ドルの「GPT-4」があります。大きな違いはGPT-4は学習データが3,410億から10兆に増え高精度化したことです。
「AIは嘘つき」という従来のイメージを払拭するほど、実用レベルになっています。そんなGPT-4をベースに進化したのが、2023年9月にリリースされた「GPT-4V」です。
ChatGPT最新版は画像生成機能を搭載
GPT-4Vの「V」はVisualのことで、画像認識機能を新たに搭載。例えば読み込ませた画像が何なのかを説明をさせたり、写真の撮り方のアドバイスを受けたり、写真に写り込んでいる場所を特定させたりなど、さまざまな使い方が可能です。
ChatGPTがパワーアップしたのは、GPT-4Vだけではありません。新たに「DALL-E3」という画像生成機能を搭載し、無料の画像生成AIサービスの代表格「StableDiffusion」のように「こんな絵を描いて」と文章で命令するだけで、指定した画像を簡単に作れるようになりました。
DALL-E3は日本語にも対応し、複雑なプロンプトも不要で、簡単な命令だけで高品質な画像を作れます。もはや、画像生成AIの決定版といっても過言ではないでしょう。
ラジオライフ編集部
最新記事 by ラジオライフ編集部 (全て見る)
- キャンピングカーで高速ETC利用する時の注意点 - 2024年9月17日
- HRD-A320は昭和50年代のBCLラジオをリファイン - 2024年9月16日
- オービスが光っても速度違反が無罪になった事例 - 2024年9月16日
- 首都高ETC専用入口に間違えて入るとどうなる? - 2024年9月16日
- ISO「819200」と圧倒的な高感度の暗視スコープ - 2024年9月15日