论文翻译:ACL-2024.Wentao Ye.Data Contamination Calibration for Black-box LLMs

Data Contamination Calibration for Black-box LLMs
https://arxiv.org/abs/2405.11930

论文提出了一种名为Polarized Augment Calibration (PAC)的新方法,用于检测LLMs中的数据污染问题。

黑盒大型语言模型的数据污染校准

摘要

大型语言模型(LLMs)的快速发展与训练数据规模的扩大密切相关。然而,未经检查的超大规模训练集引入了一系列潜在风险,如数据污染,即基准测试数据被用于训练。在这项工作中,我们提出了一种名为极化增强校准(PAC)的整体方法,以及一个名为StackMIA的全新数据集,以帮助检测污染数据并减少污染影响。PAC扩展了机器学习社区流行的MIA(成员推断攻击)——通过形成一个更全局的目标来检测训练数据,以澄清看不见的训练数据。作为开创性的工作,PAC非常即插即用,可以与大多数(如果不是全部)当前的白盒和黑盒(首次)LLMs集成。通过广泛的实验,PAC在超过4种数据集格式上的数据污染检测上,至少比现有方法提高了4.5%&#

https://github.com/HCPLab-SYSU/SR是一个名为"Deep Reasoning with Knowledge Graph for Social Relationship Understanding"的项目,由Zhouxia Wang, 陈添水, 任思捷, 余伟浩, 成慧, 林倞在IJCAI 2018上发表。你可以在arXiv上找到该项目的论文(https://arxiv.org/abs/1807.00504),并且在GitHub上找到该项目的代码(https://github.com/HCPLab-SYSU/SR)。这个项目的目标是通过知识图谱进行社交关系的理解。它在PISC数据集上进行实验,并与旧方法进行对比,取得了很好的成果。在各类亲密、非亲密、没关系的社交关系上,研究者的新方法相比旧方法获胜。在6种细分的社交关系上,新旧方法平分秋色。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [一个八卦的AI,嗅到了你和TA之间基情满满](https://blog.csdn.net/yH0VLDe8VG8ep9VGe/article/details/80970968)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [WordPress.com REST API开发人员控制台-由https://github.com/Automattic/wp-api-console取代-Node.js开发](https://download.csdn.net/download/weixin_42108778/19120401)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值