随着大语言模型(LLM)的快速发展,其在文本生成、翻译、总结等任务中的应用日益广泛。如微软前段时间发布的Copilot+PC允许使用者利用生成式AI进行团队内部实时协同合作,通过内嵌大模型应用,文本内容可能会在多个专业团队内部快速流转,对此,为保证内容的高度专业性和传达效率,同时平衡内容追溯、保证文本质量的LLM水印方法显得极为重要。
如何从使用面的事后追溯管控生成式AI的应用,因此成为了一些研究者关注的议题。
为了应对这一挑战,研究者们提出了在LLM生成过程中嵌入水印的方法,以实现对模型输出内容的追踪和溯源。
近日,马里兰大学、匹兹堡大学和滑铁卢大学的研究者在ICLR 2024上发表了一项名为「Unbiased Watermark for Large Language Models」的研究,提出了一种新的LLM水印方法——无偏水印(Unbiased Watermark)。
该方法不仅能在LLM生成过程中嵌入水印,实现内容溯源,还能保证嵌入水印后的文本质量不受影响。相关论文已被ICLR 2024会议接收为Spotlight论文。