GPT-4Vの画像認識で写真から場所が特定できる?
ChatGPTは、OpenAI社が2022年11月に公開した、人工知能チャットボット。人間のような自然な会話でさまざま生成AIのサービスを利用できるのが特長です。最新版「GPT-4V」は従来のテキストベースから画像認識機能を搭載し、完全無欠な存在に近づきつつあります。GPT-4Vの画像認識で何ができるか見ていきましょう。
GPT-4Vは画像認識で写真をテキスト化
GPT-4Vの「V」はVisualのことで、画像認識機能を新たに搭載。例えば読み込ませた画像が何なのかを説明をさせたり、写真の撮り方のアドバイスを受けたり、写真に写り込んでいる場所を特定させたりなど、さまざまな使い方が可能です。
GPT-4Vで使える画像認識の活用例に「画像の説明」があります。どういった画像なのかをテキストで説明。写真の中に写り込んでいる物や風景を的確に言語化してくれます。
GPT-4Vでは「場所の特定」も可能。写真が撮影された場所を、写り込んでいる建物の特徴などから特定します。正確に特定するためには、ランドマークになる建物や目印が必要です。
GPT-4Vは画像認識で撮影のアドバイス
GPT-4Vは「写真のアドバイス」も可能。アップロードされた写真について、構図だけでなく明るさなど撮影に関するテクニックを細かくアドバイスしてくれます。デザインや絵のアドバイスにも利用可能です。
さらに、GPT-4Vでは「宿題をやらせる」ことも可能。例えば算数の計算問題を写真に撮れば、テキスト化せずともGPT-4Vに解かせることができるというわけです。
GPT-4Vは高校生レベルの数学はカバーしているといいます。ちなみにスマホ版には、音声認識も追加されており、こちらも用途が広がっているのです。
The following two tabs change content below.
ラジオライフ編集部
ラジオライフ編集部 : 三才ブックス
モノ・コトのカラクリを解明する月刊誌『ラジオライフ』は、ディープな情報を追求するアキバ系電脳マガジンです。
■編集部ブログはこちら→https://www.sansaibooks.co.jp/category/rl
最新記事 by ラジオライフ編集部 (全て見る)
- レンタカーに適用される高速料金のETC割引は? - 2024年5月1日
- コンビニジェネリックフードは味の再現度が高い - 2024年4月30日
- 3千円以下で購入できる「UV-K5」の受信性能は? - 2024年4月30日
- ETCカードで一般レーンに入ったときの対処方法 - 2024年4月30日
- Googleフォトならアルバムを整理する手間が不要 - 2024年4月29日
この記事にコメントする
あわせて読みたい記事
関連する記事は見当たりません。