总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328
DeepInception: Hypnotize Large Language Model to Be Jailbreaker
DeepInception:催眠大型语言模型,助你成为越狱者
https://arxiv.org/pdf/2311.03191
https://www.doubao.com/chat/3388140395150082
https://github.com/tmlr-group/DeepInception
速览
- 研究动机:大语言模型易遭越狱攻击,传统方法成本高,需轻量化攻击探究安全漏洞。
- 研究问题:能否借LLM拟人化能力,通过嵌套场景使其服从