Scaling Behavior of Machine Translation with Large Language Models under Prompt Injection Attacks

本文研究大型语言模型(LLM)在机器翻译任务中的安全性,发现模型越大,在某些情况下越易受提示注入攻击。新基准数据集揭示了多语言环境中逆缩放现象,即更大模型可能更容易遭受成功攻击。此外,英文提示会导致性能显著下降,显示训练数据量的影响可能呈反比。
摘要由CSDN通过智能技术生成

本文是LLM系列文章,针对《Scaling Behavior of Machine Translation with Large Language Models under Prompt Injection Attacks》的翻译。

基于大语言模型的机器翻译在提示注入攻击下的缩放行为

摘要

大型语言模型(LLM)正日益成为许多自然语言处理任务(如机器翻译)的首选基础平台,因为它们的质量通常与特定任务模型相当或更好,并且通过自然语言指令或上下文示例来指定任务很简单。然而,它们的通用性使它们容易被最终用户颠覆,最终用户可能会在其请求中嵌入指令,导致模型以未经授权且可能不安全的方式运行。在这项工作中,我们研究了在机器翻译任务中对多个LLM家族的提示注入攻击(PIA),重点是模型大小对攻击成功率的影响。我们引入了一个新的基准数据集,我们发现在多个语言对和用英语编写的注入提示上,在某些条件下,更大的模型可能更容易受到成功攻击,这是逆缩放现象的一个例子。据我们所知,这是第一项研究多语言环境中非平凡LLM缩放行为的工作。

1 引言

2 提出的方法

3 实验

4 讨论和相关工作

5 结论

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值