- 博客(2)
- 收藏
- 关注
原创 通过信息瓶颈预防大语言模型越狱:Protecting Your LLMs with Information Bottleneck
在这项工作中,作者介绍IBProtector,这是一个基于信息瓶颈原理的防御机制。IBProtector通过一个轻量级且可训练的提取器,选择性地压缩和扰动提示,只保留目标LLMs回应预期答案所需的提示文本中核心信息。
2024-04-23 22:36:19
1023
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人