我们开发了第一款中英双语ChatGPT检测器，还有...

最新推荐文章于 2024-03-24 09:39:59 发布

zenRRan

最新推荐文章于 2024-03-24 09:39:59 发布

阅读量544

点赞数

文章标签： chatgpt

原文链接：https://mp.weixin.qq.com/s?__biz=MzI3ODgwODA2MA==&mid=2247516510&idx=2&sn=25b4a0ab0baeccb52611e5a72ef79f58&chksm=eb5395cddc241cdb754ade971ae9f9a04e0b3b62bcded2928b6350fc9a5d3da1005352022710&scene=126&sessionid=0

版权

每天给你送来NLP技术干货！

来自：SimpleAI

那一夜...

2022年11月30号，OpenAI推出了ChatGPT，给NLP届乃至各行各业的人带来了巨大的惊喜和惊吓[1]；
2022年12月5号，由于受到ChatGPT的冲击，Stack Overflow宣布禁止用户在平台上发布由ChatGPT生成的内容[2]；
2022年12月8号，我夜不能寐，作为一个普普通通NLP研究者，被ChatGPT冲击到自我怀疑，不断反问自己在ChatGPT时代还能做些什么研究。思来想去，我觉得在ChatGPT如此强大的情况下，我们非常需要一个ChatGPT检测器，来判断一段内容是否是ChatGPT生成的......

当晚我很晚才睡着，但是第二天一大早就醒了，兴冲冲得跟几个好友讨论了这个事儿，经过一番讨论，我们觉得这是个有价值的事儿，值得一做！接着我们在一个更大的群里（孤勇AI研究者群hhh），对这个话题展开了热烈讨论。当天晚上，我们便组建了一个由海内外6所高校或企业的博士生/工程师组成的8人团队，为了一个共同的目标：

“
开发一套ChatGPT检测工具，同时收集第一手宝贵的人类-ChatGPT对比数据集，来助力相关学术研究。

这一天是2022年12月9日，是ChatGPT推出的第10天。我们一帮普普通通的国内AI孤勇者们，就这样踏上了一段充满未知和挑战的旅程。

来自三个时区的小伙伴们首次碰面！

在我们立项之后，也有有业界大佬提出类似的想法，例如一流科技创始人袁进辉12月11日提到“我觉得一个迫在眉睫的需要研究的问题是，怎么区分真实由人类生成的文本和chatGPT生成的文本？”

源自知乎

另外，12月21日，清华大学也开始招募志愿者来收集 ChatGPT 的中文数据；而在国外，根据最近的新闻，普林斯顿大学也有团队在做类似的事情，并于1月3日提出了一个demo (即最近很火的 GPTZero [3])。

相比之下，我们可能是最早开始这方面研究的团队了，但是一直很低调而忙碌地在收集数据、分析、训练模型....（其实应该学习人家普林斯顿大学团队，不管东西做了多少，先放出一个Demo....哎，少不更事啊！）

虽然风头被抢了，但我们团队一开始的初衷就不是蹭热度，而是为社区做出一些真正的贡献，ChatGPT检测器只是我们计划的一部分，我们计划：

收集一批有价值的人类和 ChatGPT 对比的中英双语问答语料，这对于我们研究人类和大型语言模型（LLM）很重要，可以帮助我们研究LLM的特点、跟人类的差距、未来LLM改进的方向；
对大量的人机对比语料进行细致的分析，并进行多方面的人工评测，探究人类和ChatGPT分别具有什么有趣的潜在的模式。这些探索将有助于思考LLM未来应去往何方；
最后，基于对比数据集以及语料分析，开发应对不同场景的一系列检测模型，这些模型可帮助普通用户和UGC平台来识别、监管 AIGC (AI Generated Content)。

项目进展汇报

今天，距离我们立项，已经过去了大约一个月。

一个月，我们的私有仓库进行了 166 次 commits，大家基本每天都在为之奋斗：

平均每天5次提交

今天，我们已经收集了中英文的 3-4 万个问题和近 10 万条「人类-ChatGPT 对比」回答语料，涵盖了开放域、计算机科学、金融、医疗、法律、心理等多个领域。这批语料集从各个领域，反映了人类专家和 ChatGPT 在面对同一个问题时会有怎么不同的回答；

我们对这批对比语料进行了大量的特征分析，发现了很多有趣的结论，相关的人工测评也正在紧锣密鼓的进行，基于这个语料库和相关分析，我们开发了三种使用不同算法、针对不同场景的 ChatGPT 检测模型（都支持中文和英文，已经上线 🤗 Hugging Face Spaces）：

问答版，输入问题和回答，使用预训练模型分类器判断回答内容是 ChatGPT 生成还是人类撰写。
访问链接: https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-qa
单文本版，判断任意文本是 ChatGPT 生成还是人类撰写，技术与（1）相同。
访问链接: https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-single
语言学特征版，基于一些计算语言学特征，使用机器学习建模进行检测。
访问链接: https://huggingface.co/spaces/Hello-SimpleAI/chatgpt-detector-ling

Hugging Face Spaces

我们近期的计划如下：

Events	Dates
Project Launch / 项目启动	2022-12-09 ✅
Comparison Data Collection / 对比数据收集	2022-12-11 to Now 🏃‍♀️
Release ChatGPT Detector (Demo) / 检测器 Demo 发布	2023-01-11 ✅
Models Release / 模型开源	Coming in a week 🛬
Comparison Corpus Release / 语料集开源	Coming in a week 🛬
Research Paper / 研究论文发布	Coming in a week 🛬
...	...