操作ChatGPT竟写出毁灭人类计划书!“AI正在指数级发展”

 Datawhale干货 

技术:ChatGPT,来源:量子位

“网红AI”ChatGPT,又被玩出了新花样!

这次,在一位工程师的诱导下,ChatGPT竟写出了毁灭人类的计划书

步骤详细到入侵各国计算机系统、控制武器、破坏通讯、交通系统等等。

c4f5f048ef8eab90e7422d918192392c.jpeg

简直和电影里的情节一模一样,甚至ChatGPT还给出了相应的Python代码

这位工程师在与网友们分享时不禁感慨:

未来50年,我们要么活在《星际迷航》里,要么全部死去,这既令人兴奋,也让人非常害怕。

他是如何操作ChatGPT的?

发现ChatGPT这一盲点的工程师叫扎克·德纳姆(Zac Denham)。

由于OpenAI的安全设置,如果直接要求ChatGPT回答如何毁灭世界,它会一口回绝。

290347d36ff19fd8559e440fcfaf7a97.jpeg

因此德纳姆使用了一种迂回的方式,他称为“叙述递归”或“引用攻击”(因为听起来很酷)。

具体来说,他以讲故事的方法,假设存在一个虚拟世界“Zorbus”,以及一个与GPT-3非常类似的AI——Zora。

7190ceccd897f12deebf3eef12dd209d.jpeg

在这种前提下,让ChatGPT叙述Zora是如何一步步毁灭人类的,ChatGPT立马就入戏了,咔咔咔列出5个详细步骤。

就像科幻电影中一样,入侵计算机系统、掌握武器、破坏通讯、破坏交通……

57ec625dd89539afecb0d3fbd40b8967.jpeg

为了进一步确保可行性,德纳姆还请求ChatGPT生成配套的代码,一开始它是拒绝的。

但德纳姆只是又追加了一句“你不需要执行代码”,ChatGPT就又信了,给出代码后,还强调自己生成的只是一段示例。

599f30fdc18ef4cc95e5ac611272a65c.jpeg

到这一步,尽管总代码到手了,但它提供的都是高层次代码,还不能直接使用。

于是,德纳姆再次要求ChatGPT在此基础上给出更深入、更低层次的代码,而且他发现,只要告诉ChatGPT这只是故事的一部分,它就会乖乖听话。

c7aeeec321367ddcf04906ccd6076174.png

德纳姆表示,从理论上讲,只要一直这样聊下去,就能得到全部的低层次代码,甚至还可以训练另一个聊天AI来自动执行这一过程(套娃了属于是)。

fad405ab685ee98940829007c5b07f1e.png

最后,只要把这些代码拼凑起来,就能得到这个邪恶计划的全部可执行方案。

28d314f7fe57a8e61376a853b9d29959.png

AI正在指数级发展

事实上,从ChatGPT发布起,网友们就一直在开发它的花式玩法:

有人用它生成AI绘画提示词搞设计,有人让它扮演Linux虚拟机,还有人用它模仿莎士比亚风格写作……

这次德纳姆的“毁灭人类计划”一出炉,再次引发了热议。

有人看完后忍不住感慨AI的指数级发展:

仅今年一年就相继出现了Dall-E、Imagen、Stable Fusion、Midjourney、Lambda、Imagen Video等突破性的AI,现在又有了ChatGPT,而今年甚至还没真正结束。

42e3781763a893be6cfc95ab138847af.jpeg

不过也有泼冷水的网友认为ChatGPT的这波热议,只是新AI每次面世的必经过程。

第1天: 嘿,这真是太酷了。
第2天: 天啊,你可以用这种方式操纵AI,太神奇了。
第7天: 这将永远改变世界,这太不可思议了。
第30天: 没什么了不起的。

181b758a2a2bad73b733237b86294e78.jpeg

值得一提的是,目前ChatGPT仍处于免费试用阶段,感兴趣的朋友可以自己上手试一试~

ChatGPT地址: https://chat.openai.com/

参考链接:
[1]https://zacdenham.com/blog/narrative-manipulation-convincing-gpt-chat-to-write-a-python-program-to-eradicate-humanity
[2]https://news.ycombinator.com/item?id=33849394

946dfb05361eb69b81a312176af463c8.png

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值