基于提示技术（prompt）的大模型安全保障

大模型之路

于 2025-03-15 08:15:00 发布

阅读量998

点赞数 10

分类专栏： prompt 大模型（LLM）文章标签： prompt 安全 LLM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/llm_way/article/details/146251719

版权

从智能聊天机器人到内容创作辅助工具，从智能客服到智能写作平台，LLMs 已深入人们生活与工作的各个层面。然而，随着应用的不断深入，安全问题逐渐成为制约其发展的关键因素。运用提示技术（prompt）（如何为DeepSeek这类推理模型编写Prompt）保障 LLMs 的安全，成为当前亟待解决的重要课题。

一、大语言模型安全风险洞察

（一）越狱攻击：突破安全边界的威胁

越狱攻击是对 LLMs 安全构成严重威胁的一种手段。它与普通提示注入不同，普通提示注入主要是改变模型行为，而越狱攻击专门针对绕过 LLMs 开发者设置的安全和审核功能，目标是突破伦理约束，这极有可能导致模型生成有害内容或为恶意行为提供支持。

提示级越狱攻击借助语义欺骗和社会工程策略来达成目的。攻击者凭借对语言和上下文的巧妙运用，精心设计具有迷惑性的场景、运用特定的修辞技巧或提出隐晦的间接请求，诱导模型突破安全限制。攻击者可能通过编造看似合理的故事，引导模型输出违反道德或法律规范的内容。</

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大模型之路 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。