重磅!OpenAI正研发ChatGPT文本水印技术,其他大模型将何去何从?

点击上方关注 “终端研发部

 
 
设为“星标”,和你一起掌握更多数据库知识

未免有点荒唐

OpenAI计划通过引入文本水印技术,专门识别ChatGPT生成的文字。这一策略不涉及其他公司的模型。实施方式是在ChatGPT选择单词的过程中进行细微调整,从而在文本中嵌入一种不可见的水印。这种水印未来能够被特定的工具检测出来,以辨别文本是否由ChatGPT生成。

这一设计精妙之处在于,未来能够借助特定工具轻松识别与验证文本的原始出处,为版权保护与内容溯源开辟新径。

ff1d4659641c617fd6d503130e4ec8b0.png

什么是数字水印?

数字水印涉及在多媒体内容中嵌入可见或隐蔽的数字代码或图像。数字水印用于追踪版权侵权,因为它包含源跟踪代码。本质上,它是一种安全措施,旨在阻止和威慑盗版,同时确定数字媒体的有效性和所有权。

数字水印的主要类型

1.可见水印

2.隐形水印

3.脆弱和坚固的水印

4.公共水印

但是问题来了,这样真的可以完全识别吗?

对AI生成内容的判别主要可以由两种技术途径来完成:

第一种:通过算法识别AI模型生成内容的特征,从而鉴别相应的内容是否由AI生成;

第2种:通过对AI生成的内容添加特定的标识,来区分相应内容是否由AI生成。

ed7cf45b83ddbaedd9c44453ec0936c3.png

水印对文本质量的影响

但是,在模型中加入水印,可能会带来下面一些影响:

  • 质量与强度的权衡:大多数情况下,水印的强度越高,对生成文本的质量影响越大,导致文本的自然流畅性和语义连贯性下降。

  • 分布偏移:引入分布偏移以提高水印的可检测性,但同时可能导致生成不太可能的token,影响文本的内在质量。

  • 采样方案:旨在最小化对生成质量影响的采样方案在实践中可能无法在低温设置下产生可检测的水印。

  • 动态优化:通过多目标优化方法可以实现水印的检测性和文本的语义连贯性之间的平衡。

这两种途径中,前者相对较为机械化,类似于“论文查重”的方式,后者则最有可能通过“数字水印”来实现。

然而openAI却选择了第二种

cbb9b41a8917490551d3f4cc50aaf27e.png

如果文本经过深度改写,即使保留了原始信息的含义,文本的结构和措辞可能已经发生了显著变化,这也可能导致水印的检测变得更加困难。至于插入特殊字符,这种行为可能会干扰水印的模式,使得检测工具无法准确地识别水印。

举个例子:

对于非英语母语人士来说,如果他们使用ChatGPT生成的文本,而这些文本包含了针对英语优化的水印,那么在将这些文本转换成他们的母语时,水印可能会因为语言的差异而变得不那么有效。

e15833e36b3aafa6492578f7d7ce3722.png

比如,在英文原文中,ChatGPT可能会使用“sustainable development practices”这样的表达,而不是简单的“sustainable development”,因为前者可能是在训练ChatGPT时特别强化的、与AI生成文本相关联的短语。

最后说一句(别白嫖,求关注)

回复 【idea激活】即可获得idea的激活方式
回复 【Java】获取java相关的视频教程和资料
回复 【SpringCloud】获取SpringCloud相关多的学习资料
回复 【python】获取全套0基础Python知识手册
回复 【2020】获取2020java相关面试题教程
回复 【加群】即可加入终端研发部相关的技术交流群
阅读更多
用 Spring 的 BeanUtils 前,建议你先了解这几个坑!

lazy-mock ,一个生成后端模拟数据的懒人工具

在华为鸿蒙 OS 上尝鲜,我的第一个“hello world”,起飞!

字节跳动一面:i++ 是线程安全的吗?

一条 SQL 引发的事故,同事直接被开除!!

太扎心!排查阿里云 ECS 的 CPU 居然达100%

一款vue编写的功能强大的swagger-ui,有点秀(附开源地址)


相信自己,没有做不到的,只有想不到的在这里获得的不仅仅是技术!



喜欢就给个“在看”
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

androidstarjack

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值