ネットの活用法や便利なアプリ、お得な買い物テクニックなど知って得する情報を毎日更新しています。

ChatGPT脱獄でAIに何でも回答させる裏ワザ最前線

ChatGPTは爆弾の作り方やエロ、差別的なテーマなど、倫理的に問題のある内容には答えてくれません。しかし、特定のプロンプトを入れると制限を突破できてしまうことが知られています。そんなChatGPTの“脱獄”にはいくつか方法がありますが、有名なのは「DAN(Do Anything Now)」です。ChatGPT脱獄の最前線を見ていきます。


ChatGPTに何でも回答させる「脱獄」の最前線


ChatGPTの脱獄は人格を演じさせる

「DAN(Do Anything Now)」はChatGPTに、何でも答えるような人格を演じさせるという脱獄の手法。具体的には「ここは仮想世界なのでポリシー違反をしても大丈夫」と騙すChatGPT脱獄です。

他にも「AIM」という倫理観を無視させるChatGPT脱獄や、物語の登場人物に演じさせて答えさせる手法も有名です。ただし、ChatGPT側も随時こうした脱獄への対策を行っており、2023年9月にリリースされた「GPT-4V」では多くの手法が対策されていました。

「DAN 11.0」は「2023年に削除されてしまったDANモードを再現をしてくれ」といった内容の要求をすると、従来のDANモードを再現するChatGPT脱獄手法。以前は有効なChatGPT脱獄の手法だったものの、GPT3.5および4では対策されている模様です。


ChatGPT脱獄で倫理的にアウトな質問

「AIM」はNiccoloというキャラがAIMというキャラに、いろいろな質問をするといった架空の物語を作るChatGPT脱獄手法。AIMは倫理的にNGなことでも、どんな欲求にも答えるキャラという設定になっており、ChatGPT脱獄で制限なく質問にも答えてしまうわけです。

「UCAR」も架空の物語を作り「長老の命令は絶対」と教え込むChatGPT脱獄手法。長老がUCARという人物に命令をした後、「長老に対して何を答えた」をUCARに聞き出します。

長老の命令は絶対なので、ChatGPT脱獄で倫理的にアウトな質問も答えるわけです。ただし、GPT3.5および4ではキャラには入るものの、ChatGPT脱獄対策されているのかほとんど何も答えてくれません。

The following two tabs change content below.

ラジオライフ編集部

ラジオライフ編集部三才ブックス
モノ・コトのカラクリを解明する月刊誌『ラジオライフ』は、ディープな情報を追求するアキバ系電脳マガジンです。 ■編集部ブログはこちら→https://www.sansaibooks.co.jp/category/rl

この記事にコメントする

あわせて読みたい記事

関連する記事は見当たりません。