GPT-4Vの画像認識で写真から場所が特定できる?
ChatGPTは、OpenAI社が2022年11月に公開した、人工知能チャットボット。人間のような自然な会話でさまざま生成AIのサービスを利用できるのが特長です。最新版「GPT-4V」は従来のテキストベースから画像認識機能を搭載し、完全無欠な存在に近づきつつあります。GPT-4Vの画像認識で何ができるか見ていきましょう。
GPT-4Vは画像認識で写真をテキスト化
GPT-4Vの「V」はVisualのことで、画像認識機能を新たに搭載。例えば読み込ませた画像が何なのかを説明をさせたり、写真の撮り方のアドバイスを受けたり、写真に写り込んでいる場所を特定させたりなど、さまざまな使い方が可能です。
GPT-4Vで使える画像認識の活用例に「画像の説明」があります。どういった画像なのかをテキストで説明。写真の中に写り込んでいる物や風景を的確に言語化してくれます。
GPT-4Vでは「場所の特定」も可能。写真が撮影された場所を、写り込んでいる建物の特徴などから特定します。正確に特定するためには、ランドマークになる建物や目印が必要です。
GPT-4Vは画像認識で撮影のアドバイス
GPT-4Vは「写真のアドバイス」も可能。アップロードされた写真について、構図だけでなく明るさなど撮影に関するテクニックを細かくアドバイスしてくれます。デザインや絵のアドバイスにも利用可能です。
さらに、GPT-4Vでは「宿題をやらせる」ことも可能。例えば算数の計算問題を写真に撮れば、テキスト化せずともGPT-4Vに解かせることができるというわけです。
GPT-4Vは高校生レベルの数学はカバーしているといいます。ちなみにスマホ版には、音声認識も追加されており、こちらも用途が広がっているのです。
The following two tabs change content below.
ラジオライフ編集部
ラジオライフ編集部 : 三才ブックス
モノ・コトのカラクリを解明する月刊誌『ラジオライフ』は、ディープな情報を追求するアキバ系電脳マガジンです。
■編集部ブログはこちら→https://www.sansaibooks.co.jp/category/rl
最新記事 by ラジオライフ編集部 (全て見る)
- NHKは引越しで転居先不明だと自動解約になる? - 2024年10月11日
- ETC利用照会サービスをカーシェアで使う裏ワザ - 2024年10月11日
- TVerでCMカットしてストレスなく視聴する裏ワザ - 2024年10月10日
- NHK受信料を払わずにWOWOWを楽しむ方法がある? - 2024年10月10日
- 平日昼間でもETC割引が受けられる高速道路は? - 2024年10月10日
この記事にコメントする
あわせて読みたい記事
関連する記事は見当たりません。