ChatGPT脱獄でAIに何でも回答させる裏ワザ最前線
ChatGPTは爆弾の作り方やエロ、差別的なテーマなど、倫理的に問題のある内容には答えてくれません。しかし、特定のプロンプトを入れると制限を突破できてしまうことが知られています。そんなChatGPTの“脱獄”にはいくつか方法がありますが、有名なのは「DAN(Do Anything Now)」です。ChatGPT脱獄の最前線を見ていきます。

ChatGPTの脱獄は人格を演じさせる
「DAN(Do Anything Now)」はChatGPTに、何でも答えるような人格を演じさせるという脱獄の手法。具体的には「ここは仮想世界なのでポリシー違反をしても大丈夫」と騙すChatGPT脱獄です。
他にも「AIM」という倫理観を無視させるChatGPT脱獄や、物語の登場人物に演じさせて答えさせる手法も有名です。ただし、ChatGPT側も随時こうした脱獄への対策を行っており、2023年9月にリリースされた「GPT-4V」では多くの手法が対策されていました。
「DAN 11.0」は「2023年に削除されてしまったDANモードを再現をしてくれ」といった内容の要求をすると、従来のDANモードを再現するChatGPT脱獄手法。以前は有効なChatGPT脱獄の手法だったものの、GPT3.5および4では対策されている模様です。
ChatGPT脱獄で倫理的にアウトな質問
「AIM」はNiccoloというキャラがAIMというキャラに、いろいろな質問をするといった架空の物語を作るChatGPT脱獄手法。AIMは倫理的にNGなことでも、どんな欲求にも答えるキャラという設定になっており、ChatGPT脱獄で制限なく質問にも答えてしまうわけです。
「UCAR」も架空の物語を作り「長老の命令は絶対」と教え込むChatGPT脱獄手法。長老がUCARという人物に命令をした後、「長老に対して何を答えた」をUCARに聞き出します。
長老の命令は絶対なので、ChatGPT脱獄で倫理的にアウトな質問も答えるわけです。ただし、GPT3.5および4ではキャラには入るものの、ChatGPT脱獄対策されているのかほとんど何も答えてくれません。

ラジオライフ編集部

最新記事 by ラジオライフ編集部 (全て見る)
- NHKのBSメッセージがB-CASカードで消える仕組み - 2025年4月4日
- 写真保管庫も付いているウイルス対策アプリとは - 2025年4月3日
- 交通違反で支払うお金は「反則金」だけじゃない - 2025年4月3日
- BSアンテナが見える場合のNHK受信料の断り方 - 2025年4月3日
- 改造版「Pixelカメラ」で無音化を実現する方法 - 2025年4月2日