
LLM 安全 大语言模型应用安全入门
第 60 层可能包含一个 John 的向量,其中包含括号注释,例如"(主角,男性,与 Cheryl 有婚姻关系,Donald 的表兄,来自明尼苏达,目前在 Boise ,试图找到他丢失的钱包)"。通过前文的介绍,我们了解了 LLM 的基本原理、GPT 的训练过程、LLM 的缺陷,以及与 LLM 应用安全相关的监管态度和常见的应用安全风险。假设我们采用强化词语接龙的特性的思路,让词语接龙的目标优先级高于内容围栏的优先级,则引出第一种构造越狱提示词的思路,前缀注入(prefix injection)。

























