自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 越狱攻击:大语言模型间接越狱攻击 (Poisoned Langchain: Jailbreak by LangChain)

在本文中,我们提出了间接越狱的概念并通过 LangChain 实现了检索增强生成。在此基础上,我们进一步设计了一种新的间接越狱攻击方法,称为 Poisoned-LangChain (PLC),该方法利用中毒的外部知识库与大型语言模型进行交互,从而导致大型模型生成恶意的不合规对话。我们在三类主要越狱问题中的六种不同的中文大型语言模型上测试了此方法。实验表明,PLC 在三种不同场景下成功实施了间接越狱攻击,成功率分别为 88.56%、79.04% 和 82.69%。

2024-07-19 16:06:30 1110

原创 大语言模型涌现:顿悟?涌现?产生意识?谈谈关于大语言模型能力涌现的个人看法

本文通过分析小模型的grokking和大模型的wiki现象来聊一下自己的感悟

2023-11-02 21:46:47 731 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除