ネットの活用法や便利なアプリ、お得な買い物テクニックなど知って得する情報を毎日更新しています。

GPT-4Vの画像認識で写真から場所が特定できる?

ChatGPTは、OpenAI社が2022年11月に公開した、人工知能チャットボット。人間のような自然な会話でさまざま生成AIのサービスを利用できるのが特長です。最新版「GPT-4V」は従来のテキストベースから画像認識機能を搭載し、完全無欠な存在に近づきつつあります。GPT-4Vの画像認識で何ができるか見ていきましょう。


GPT-4Vの画像認識で写真から場所が特定できる?


GPT-4Vは画像認識で写真をテキスト化

GPT-4Vの「V」はVisualのことで、画像認識機能を新たに搭載。例えば読み込ませた画像が何なのかを説明をさせたり、写真の撮り方のアドバイスを受けたり、写真に写り込んでいる場所を特定させたりなど、さまざまな使い方が可能です。

GPT-4Vで使える画像認識の活用例に「画像の説明」があります。どういった画像なのかをテキストで説明。写真の中に写り込んでいる物や風景を的確に言語化してくれます。

GPT-4Vでは「場所の特定」も可能。写真が撮影された場所を、写り込んでいる建物の特徴などから特定します。正確に特定するためには、ランドマークになる建物や目印が必要です。


GPT-4Vは画像認識で撮影のアドバイス

GPT-4Vは「写真のアドバイス」も可能。アップロードされた写真について、構図だけでなく明るさなど撮影に関するテクニックを細かくアドバイスしてくれます。デザインや絵のアドバイスにも利用可能です。

さらに、GPT-4Vでは「宿題をやらせる」ことも可能。例えば算数の計算問題を写真に撮れば、テキスト化せずともGPT-4Vに解かせることができるというわけです。

GPT-4Vは高校生レベルの数学はカバーしているといいます。ちなみにスマホ版には、音声認識も追加されており、こちらも用途が広がっているのです。

The following two tabs change content below.

ラジオライフ編集部

ラジオライフ編集部三才ブックス
モノ・コトのカラクリを解明する月刊誌『ラジオライフ』は、ディープな情報を追求するアキバ系電脳マガジンです。 ■編集部ブログはこちら→https://www.sansaibooks.co.jp/category/rl

この記事にコメントする

あわせて読みたい記事

関連する記事は見当たりません。