ネットの活用法や便利なアプリ、お得な買い物テクニックなど知って得する情報を毎日更新しています。

ChatGPT最新版に搭載された画像認識&生成機能

「ChatGPT」の登場から1年が経ち、世界中のさまざまな分野に大きな影響を与えています。最新版「GPT-4V」は従来のテキストベースから画像認識機能を搭載し、完全無欠な存在に近づきつつあります。さらには、新たに「DALL-E3」という画像生成機能を搭載。ChatGPTは最新版でどのように進化しているのかを見ていきましょう。


ChatGPT最新版に搭載された画像認識&生成機能


ChatGPT最新版にGPT-4Vがリリース

ChatGPTは、OpenAI社が2022年11月に公開した、人工知能チャットボット。人間のような自然な会話でさまざま生成AIのサービスを利用できるのが特長です。

現在、ChatGPTには無料で使える「GPT-3.5」と月額20ドルの「GPT-4」があります。大きな違いはGPT-4は学習データが3,410億から10兆に増え高精度化したことです。

「AIは嘘つき」という従来のイメージを払拭するほど、実用レベルになっています。そんなGPT-4をベースに進化したのが、2023年9月にリリースされた「GPT-4V」です。


ChatGPT最新版は画像生成機能を搭載

GPT-4Vの「V」はVisualのことで、画像認識機能を新たに搭載。例えば読み込ませた画像が何なのかを説明をさせたり、写真の撮り方のアドバイスを受けたり、写真に写り込んでいる場所を特定させたりなど、さまざまな使い方が可能です。

ChatGPTがパワーアップしたのは、GPT-4Vだけではありません。新たに「DALL-E3」という画像生成機能を搭載し、無料の画像生成AIサービスの代表格「StableDiffusion」のように「こんな絵を描いて」と文章で命令するだけで、指定した画像を簡単に作れるようになりました。

DALL-E3は日本語にも対応し、複雑なプロンプトも不要で、簡単な命令だけで高品質な画像を作れます。もはや、画像生成AIの決定版といっても過言ではないでしょう。

The following two tabs change content below.

ラジオライフ編集部

ラジオライフ編集部三才ブックス
モノ・コトのカラクリを解明する月刊誌『ラジオライフ』は、ディープな情報を追求するアキバ系電脳マガジンです。 ■編集部ブログはこちら→https://www.sansaibooks.co.jp/category/rl

この記事にコメントする

あわせて読みたい記事

関連する記事は見当たりません。