ICLR 2024 | 无需训练,Fast-DetectGPT让文本检测速度提升340倍

Fast-DetectGPT 同时做到了高准确率、高速度、低成本、通用,扫清了实际应用的障碍!

大语言模型如 ChatGPT 和 GPT-4 在各个领域对人们的生产和生活带来便利,但其误用也引发了关于虚假新闻、恶意产品评论和剽窃等问题的担忧。本文提出了一种新的**文本检测方法 ——Fast-DetectGPT,**无需训练,直接使用开源小语言模型检测各种大语言模型生成的文本内容。

Fast-DetectGPT 将检测速度提高了 340 倍,将检测准确率相对提升了 75% ,成为新的 SOTA。在广泛使用的 ChatGPT 和 GPT-4 生成文本的检测上,均超过商用系统 GPTZero 的准确率

Fast-DetectGPT 同时做到了高准确率、高速度、低成本、通用,扫清了实际应用的障碍!

图片

研究动机

大语言模型(LLMs)在各个领域已产生了深远影响。这些模型在新闻报道、故事写作和学术研究等多元领域提升了生产力。然而,它们的误用也带来了一些问题,特别是在假新闻、恶意产品评论和剽窃方面。这些模型生成的内容流畅连贯,甚至让专家都难以辨别其来源是人类还是机器。因此,我们需要可靠的机器生成文本检测方法来解决这个问题。

现有的检测器主要分为两类:有监督分类器和零样本分类器。虽然有监督分类器在其特定训练领域表现出色,但在面对来自不同领域或不熟悉模型生成的文本时,其表现会变差。零样本分类器则能够免疫领域特定的退化,并且在检测精度上可以与有监督分类器相媲美。

然而,典型的零样本分类器,如 DetectGPT,需要执行大约一百次模型调用或与 OpenAI API 等服务交互来创建扰动文本,这导致了过高的计算成本和较长的计算时间。同时它需要用生成文本的源语言模型来进行检测的计算,使得该方法不能用于检测由未知模型生成的文本。

在这篇论文中,我们提出了一种新的假设来检测机器生成的文本。我们认为,人类和机器在给定上下文的情况下选择词汇存在明显的差异,而机器和机器之间的差异不明显。利用这种差异我们能够有效地用一套模型和方法检测不同模型生成的文本内容

方法

Fast-DetectGPT 的操作基于一个前提,即人类和机器在文本生成过程中倾向于选择不同的词汇,人类的选择比较多样,而机器更倾向于选择具有更高模型概率的词汇。

这个假设源于这样一个事实,即在大规模语料库上预训练的 LLM 反映的是人类的集体写作行为,而非个体的写作行为,这导致它们在给定上下文时的词汇选择存在差异。

这个假设在一定程度上也得到了文献中的观察结果的支持,这些观察结果表明,机器生成的文本通常具有比人类写作的文本有更高的统计概率(或更低的困惑度)。

然而,我们的方法并不仅仅依赖于机器生成文本具有更高的统计概率的假设。而是进一步假设,在条件概率函数中,机器生成的文本周围的局部空间存在一个正曲率。据此,我们提出条件概率曲率指标,用以区分机器生成文本和人类撰写文本。

我们的实验观察如图 1 所示,在四个不同开源模型上,人类撰写文本的条件概率曲率近似一个均值为 0 的正态分布,而机器生成文本的条件概率曲率近似一个均值为 3 的正态分布,这两个分布只有少量的重叠。根据这种分布上的特点,我们可以选择一个阈值,大于这个阈值判断为机器生成文本,小于则为人类撰写,从而获得一个检测器。

图片

图 1:条件概率曲率在不同源模型设定上的分布

条件概率曲率

给定一个输入文本段落 x 和模型图片,我们使用的条件概率可以形式化的表达为:

图片

可以看到,在给定 x 的条件下,图片的不同位置上的 tokens图片之间是互相独立的。这种条件独立性质将给我们的采样带来极大的便利。

进一步,给定打分模型图片和采样模型图片,我们将条件概率曲率形式化的表达为:

图片

其中:

图片

图片

图片表示由采样模型图片生成的样本图片在打分模型图片上的期望得分,图片表示得分的期望方差。我们用随机样本的平均对数概率来近似期望得分图片,用对数概率的样本方差来近似期望方差图片

条件独立采样

对替代tokens图片的独立采样是 Fast-DetectGPT 能快速计算的关键。具体来说,我们在固定文本 x 的条件下,从图片中采样每个token图片,而不依赖于其他采样的token。

在实践中,我们可以简单地通过一行 PyTorch 代码生成 10,000 个样本(我们的默认设置):samples = torch.distributions.categorical.Categorical (logits=lprobs).sample ([10000]),其中 lprobs 是图片的对数概率分布,j 从 0 到 x 的长度。

采样过程对我们理解 Fast-DetectGPT 的机制起着关键的作用。为了判断给定上下文中的一个token是机器生成的还是人类编写的,必须将其与同一上下文中的一系列替代token进行比较。通过采样大量的替代token(比如说 10,000 个),我们可以有效地描绘出它们的图片值的分布。将原始文本token的图片值放在这个分布中,可以清楚地看到它的相对位置,使我们能够确定它是一个异常值还是一个更典型的选择。这个基本的洞察形成了 Fast-DetectGPT 方法的核心理念。

检测过程

如图 2 所示,Fast-DetectGPT 提出了一个新的三步检测过程,包括 1)采样 – 我们引入一个采样模型,给定条件 x 生成备选样本图片,2)打分 – 通过将 x 作为输入的评分模型的单次前向传递,可以轻易获得条件概率。所有样本都可以在同一预测分布中进行评估,因此我们不需要多次调用模型,以及 3)比较 – 段落和样本的条件概率被比较以计算条件概率曲率。更多的细节在论文的算法部分进行了详细描述。

图片

图 2:Fast-DetectGPT vs DetectGPT

我们发现 “采样” 和 “打分” 两个步骤在实现上可以进一步合并,并有一个解析解,而不是采样近似,详细论述和证明见论文附录 B。此外,我们发现使用相同的模型进行采样和评分时,条件概率曲率与简单的似然函数和熵基线有紧密的联系,具体论述见论文第 2 章结束部分。

实验结果

图片

表 1:结果概况

如表 1 所示,Fast-DetectGPT 和基线 DetectGPT 相比,在速度上提升 340 倍,在检测准确率上相对提升约 75%,具体展开如下。

340 倍的推理加速

我们比较了 Fast-DetectGPT 和 DetectGPT 在 Tesla A100 GPU 上的推理时间(不包括初始化模型的时间)。尽管 DetectGPT 使用了 GPU 批处理,将 100 个扰动分成 10 个批次,但它仍然需要大量的计算资源。它在五次运行中(对应 5 个源模型)总共需要 79,113 秒(大约 22 小时)。相比之下,Fast-DetectGPT 仅用 233 秒(大约 4 分钟)就完成了任务,实现了约 340 倍的显著加速,突显出其显著的性能提升。

准确的 ChatGPT 和 GPT-4 文本检测

我们进一步在黑盒环境中评估 Fast-DetectGPT,使用由 ChatGPT 和 GPT-4 生成的段落来模拟真实世界场景。我们为每个数据集和源模型生成了 150 个样本,包括 150 个模型生成的文本段落和 150 个人工撰写的文本段落。

图片

表 2:ChatGPT 和 GPT-4 生成内容的检测效果(AUROC)

如表 2 所示,Fast-DetectGPT 展现出一致的优越的检测能力。它在 ChatGPT 和 GPT-4 的相对 AUROC 上分别超过了 DetectGPT 的 78.3%和 75.1%。与监督检测器 RoBERTa-base/large 相比,Fast-DetectGPT 实现了更高的整体准确性。这些结果展示 Fast-DetectGPT 在真实世界场景中工作的潜力。

更有趣的是,商业模型 GPTZero 在新闻(XSum)上表现较好,但在故事(WritingPrompts)和技术写作(PubMedQA)上表现较差。我们猜测该模型是有监督的检测器,其训练数据中可能包含比较多的新闻语料。虽然商用模型一般都有额外的针对性的效果上的改进,但总体上 Fast-DetectGPT 比 GPTZero 还是要好 2 到 3 个点。

低误报率、高召回率

在实际使用中,我们希望检测器有较低的误报率,否则会给用户带来困扰,伤害真实的内容创作者。在较低误报率的前提下,我们希望检测器有较高的召回率,能够识别出大部分机器生成的内容。

图片

图 3:误报率(False Positive Rate) vs 召回率(True Positive Rate)

如图 3 所示,在正负样本一比一的 WritingPrompts 评测数据集上,橙色线标示的 Fast-DetectGPT 对比紫色线标示的 DetectGPT 和其它方法。我们可以看到,在误报率为 1% 的条件下,使用 Fast-DetectGPT 能获得的召回率比其它方法高出很多。比如说,在 ChatGPT 生成文本上,Fast-DetectGPT 能达到 87% 的召回率,而 Likelihood 和 DetectGPT 只有 64% 和 6% 的召回率。在 GPT-4 生成文本上,差距进一步拉大,Fast-DetectGPT 能达到 44% 的召回率,而 Likelihood 和 DetectGPT 只有 9% 和 0% 的召回率。

文本越长准确率越高

零样本检测器由于其统计性质,对较短的文本段落表现通常比较差。我们通过将 WritingPrompts 评测数据集中的文本段落截断到各种目标长度来进行评估。

图片

图 4:不同长度上的鲁棒性

如图 4 所示,这些检测器在由 ChatGPT 生成的段落上,整体检测准确率随着段落长度的增加而增加。在 GPT-4 生成的段落上,检测准确率显示出不一致的趋势。

具体来说,当段落长度增加时,有监督检测器的性能表现出下降趋势,而 DetectGPT 在开始时经历了一个增涨,然后在段落长度超过 90 个词时出现了显著的下降。

我们推测,有监督检测器和 DetectGPT 的非单调趋势源于它们将段落视为一个整体的token链(token chain),导致其检测效果不能泛化到不同长度的文本上。相比之下,Fast-DetectGPT 在段落长度增加时表现出一致的、单调的准确性增加,展示稳健的效果。

结语

主要结论: 通过研究发现,条件概率曲率是机器生成文本上更本质的指标,验证了我们关于机器和人类文本生成过程区别的假设。基于这个新假设,检测器 Fast-DetectGPT 在 DetectGPT 基础上加速了两个数量级,并在白盒和黑盒设置中都显著提高了检测精度。

未来展望: Fast-DetectGPT 依赖于预训练语言模型来覆盖多个领域和语言,但没有单一的模型可以覆盖所有的语言和领域,要使检测器更通用,我们可能需要联合多个语言模型以获得更全面的覆盖。另一方便,条件概率曲率能区分机器生成文本和人类撰写文本,也可能区分由两个不同模型生成的文本(作者识别),还可能用于判别 OOD 文本(OOD 检测)。这些方向的应用值得进一步研究。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

在这里插入图片描述

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取==🆓

在这里插入图片描述

  • 18
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值