WaterJudge: Quality-Detection Trade-off when Watermarking Large Language Models
LLM等水印生成人工智能系统因其在广泛任务中增强的能力而引起了人们的极大兴趣。尽管目前的方法已经证明,单词分布中与上下文相关的微小变化可以用于应用和检测水印,但在分析这些扰动对生成文本质量的影响方面几乎没有工作。在选择适当的水印设置方面,平衡高可检测性和最小的性能退化是至关重要的;因此,本文提出了一个简单的分析框架,其中使用比较评估,一个灵活的NLG评估框架,来评估特定水印设置引起的质量下降。
复制链接