论文翻译：arxiv-2024.Shahriar Golchin.Data Contamination Quiz: A Tool to Detect and Estimate

CSPhD-winston-杨帆

已于 2024-09-22 15:38:38 修改

阅读量647

点赞数 17

分类专栏： LLMs-数据污染论文翻译文章标签：语言模型人工智能深度学习

于 2024-09-07 20:57:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WhiffeYF/article/details/142004065

版权

论文翻译同时被 2 个专栏收录

92 篇文章 2 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

LLMs-数据污染

48 篇文章 0 订阅

订阅专栏

Data Contamination Quiz: A Tool to Detect and Estimate Contamination in Large Language Models
https://arxiv.org/abs/2311.06233

数据污染测验：一种检测和估计大型语言模型中污染的工具

文章目录

数据污染测验：一种检测和估计大型语言模型中污染的工具
摘要
1 引言

摘要

我们提出了数据污染测验（Data Contamination Quiz，DCQ），这是一种简单有效的检测大型语言模型（LLMs）中数据污染的方法，并估计污染的程度。具体来说，我们将数据污染检测构建为一系列多项选择问题，并设计了一种测验格式，其中从特定数据集分区（例如，GSM8k测试集）的每个子样本实例创建三个扰动版本。这些变化仅包括单词级别的扰动。生成的扰动，连同原始数据集实例，构成了DCQ中的选项，额外提供一个选项以容纳选择无提供选项的可能性。鉴于选项之间的唯一区别是与原始数据集实例的确切措辞，当LLM被赋予识别原始数据集实例的任务时，如果它在预训练阶段接触过它，它会倾向于选择原始的一个——这是LLM固有的特征。在考虑LLM的位置偏差的同时，测验表现揭示了被

了解本专栏

超级会员免费看

CSPhD-winston-杨帆

关注

17
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。