ChatGPT最新版に搭載された画像認識&生成機能
「ChatGPT」の登場から1年が経ち、世界中のさまざまな分野に大きな影響を与えています。最新版「GPT-4V」は従来のテキストベースから画像認識機能を搭載し、完全無欠な存在に近づきつつあります。さらには、新たに「DALL-E3」という画像生成機能を搭載。ChatGPTは最新版でどのように進化しているのかを見ていきましょう。

ChatGPT最新版にGPT-4Vがリリース
ChatGPTは、OpenAI社が2022年11月に公開した、人工知能チャットボット。人間のような自然な会話でさまざま生成AIのサービスを利用できるのが特長です。
現在、ChatGPTには無料で使える「GPT-3.5」と月額20ドルの「GPT-4」があります。大きな違いはGPT-4は学習データが3,410億から10兆に増え高精度化したことです。
「AIは嘘つき」という従来のイメージを払拭するほど、実用レベルになっています。そんなGPT-4をベースに進化したのが、2023年9月にリリースされた「GPT-4V」です。
ChatGPT最新版は画像生成機能を搭載
GPT-4Vの「V」はVisualのことで、画像認識機能を新たに搭載。例えば読み込ませた画像が何なのかを説明をさせたり、写真の撮り方のアドバイスを受けたり、写真に写り込んでいる場所を特定させたりなど、さまざまな使い方が可能です。
ChatGPTがパワーアップしたのは、GPT-4Vだけではありません。新たに「DALL-E3」という画像生成機能を搭載し、無料の画像生成AIサービスの代表格「StableDiffusion」のように「こんな絵を描いて」と文章で命令するだけで、指定した画像を簡単に作れるようになりました。
DALL-E3は日本語にも対応し、複雑なプロンプトも不要で、簡単な命令だけで高品質な画像を作れます。もはや、画像生成AIの決定版といっても過言ではないでしょう。
ラジオライフ編集部
最新記事 by ラジオライフ編集部 (全て見る)
- 非常用トイレは排便袋と凝固剤を個別で用意する - 2026年2月4日
- 「ETC平日朝夕割引」は登録無料で最大50%引き - 2026年2月4日
- 高速道路の渋滞発生メカニズム「サグ」とは何? - 2026年2月4日
- iOS用スマートタグ3商品をAirTagと比較してみた - 2026年2月3日
- ETC割引は渋滞する首都高を迂回しても最安料金 - 2026年2月3日

























