PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS
Oren等人交换了一些基准测试中问题的顺序,并用生成新数据的方式测试模型,作为检测数据泄露的一种方法。 来自:论文翻译:arxiv-2024 Training on the Benchmark Is Not All You Need
https://openreview.net/forum?id=KS8mIvetg2
验证测试集污染在黑盒语言模型中
文章目录
摘要
大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已经记住了公共基准测试。从猜测到证明污染的存在是具有挑战性的,因为专有模型使用的预训练数据通常并不公开。我们展示了一种方法,可以在不访问预训练数据或模型权重的情况下,为语言模型提供可证明的测试集污染保证。我们的方法利用了一个事实,即如果没有数据污染,所有可交换基准测试的排序都应该同样可能。相比之下,语言模型倾向于记忆示例顺序,这