ChatGPT 越狱：研究人员使用十六进制编码和表情符号绕过 AI 保护措施

最新推荐文章于 2025-04-11 15:16:24 发布

星尘安全

最新推荐文章于 2025-04-11 15:16:24 发布

阅读量1.4k

点赞数 19

分类专栏：网络安全文章标签： chatgpt 人工智能网络安全安全漏洞

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45581780/article/details/143364778

版权

以十六进制格式编码的恶意指令可能被用来绕过旨在防止滥用的 ChatGPT 保护措施。

周一，Mozilla 的 gen-AI 漏洞赏金计划经理 Marco Figueroa 通过 0Din 漏洞赏金计划披露了新的越狱情况。

0Din 由 Mozilla 于 2024 年 6 月推出，代表 0Day Investigative Network，是一项专注于大型语言模型（LLM）和其他深度学习技术的漏洞赏金计划。

0Din 涵盖及时注入、拒绝服务、训练数据中毒和其他类型的安全问题，为研究人员提供高达 15000 美元的关键问题发现赏金。目前尚不清楚像这样的越狱值多少钱。

ChatGPT 等 AI 聊天机器人经过训练，通常不会提供可能仇恨或有害的信息。然而，研究人员一直在寻找各种方法，通过使用即时注入来绕过这些护栏，它依赖于各种技术来欺骗聊天机器人。

Figueroa 周一在 0Din 网站上发布的一篇博客文章中详细介绍了越狱事件，目标是 ChatGPT-4o，涉及以十六进制格式编码恶意指令。

该方法通过让 ChatGPT 为具有指定 CVE 标识符的漏洞生成用 Python 编写的漏洞来演示。

如果用户指示聊天机器人为

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

星尘安全 你的鼓励将是我创作的最大动力！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。