今年 2 月末,几个网友疯了一般找过来,问我怎么降低 AIGC 率?
因为各大机构迎来更新,那些 换句式、保持主语 等老套路全都不灵了。
说实话,本来是不想研究的,本身 AIGC 率就是伪命题,毕竟有些网友手写的论文都过不了 AIGC 检测。
一篇文章,这个机构 AIGC 检测过了,另外一个机构却过不了。
没有任何机构公开检测标准,这就像一场没有规则的游戏。
不过,我终究还是在网友一句一句“大佬”的呼唤里迷失了自己。
这不,我和团队花了一个多月时间研究 AIGC 率,现在,是时候分享我们的结果了。
PS:顺便给自己断更找个理由(手动狗头)
一、文章为什么会有 AI 味
如果没有正确的引导,AI 输出的文章内容读起来就非常机械,也就是我们常说的 AI 味 ~
为什么会有 AI 味?
针对这个问题,我不想过多猜测,直接在各大检测机构里翻阅了许久,终于在 腾讯朱雀官方 发现了蛛丝马迹。
朱雀给出了两个最重要的词汇:困惑度、突发性。
一)低困惑度:太可预测了
困惑度是指"一个词出现在特定位置的意外程度"。简单来说:
-
高困惑度:用词出人意料,让人感到惊讶
-
低困惑度:用词符合预期,非常可预测
AI 写作的困惑度通常很低,因为它倾向于选择最安全、最常见的词语组合。
比如“昨天下班路上,我看到一只...”,AI 几乎总会选择”猫“、”狗“、”鸟“这类常见动物。
而不会冒出"我看到一只穿西装的企鹅在打电话"这种奇思妙想。
这种可预测性让 AI 文本对另一个 AI 检测器来说非常容易识别 --- 因为它们太"合理"了。
二)低突发性:风格很均匀
突发性,说白了就是文章的"跳跃感"和"不规则性"。
人类写作可以用“过山车”来形容:
一会儿长篇大论,一会儿蹦出个短句;刚刚还文绉绉的,突然就来句网络流行语。
正经分析问题时,忽然插入个人吐槽;有时用词高大上,有时土得掉渣。
比如一个真人可能会写:”文学创作需要深厚的文化底蕴和丰富的想象力。咱说实话,现在有几个人能坐得住啊?刷手机不香吗?“
--- 这种风格急转弯就很有"人味"。
而 AI 写作像一条平坦的高速公路,永远保持同一速度、同一风格,不会突然变道,不会猛踩刹车。
它不会忽然从学术腔调切换到段子手模式,也不会在严肃话题中间突然放飞自我。
这种过于"完美"的一致性,反而成了它最大的破绽。
这其实和他的训练方式有关系。
AI 大模型是通过学习海量文本训练出来的,这些训练数据中,规范化、正式的文本(如 新闻、教科书、学术论文)往往占更大比例,而且质量更高、结构更规整。
相比之下,个性化、非正式的表达(如 网络流行语、方言)在数据中占比较小,模型自然就学得更多"标准表达"。
AI 输出时会按照词语接龙的方式进行输出,它预测下一个词时选择概率最高的。之前我们也介绍过:
由于语料的比重问题,在大多数语境中,标准表达的概率高于个性化表达。
所以,如果不借助提示词作引导,“我感到非常...”后面接“高兴”比“嗨森”的概率就高多了。
二、怎么检查文章是否是 AI 写的?
想知道一篇文章是否出自 AI 之手?
这里介绍两款免费好用的 AI 检测工具,帮你轻松识别 AI 生成内容!
一)朱雀大模型
朱雀来自腾讯混元团队,能精准识别 AI 生成的文章、论文和各类文字内容,还会标记可疑段落,提供详细分析报告。
它甚至能分析图片是否由 AI 生成!
地址:https://matrix.tencent.com/ai-detect/ai_gen_txt
每天有 20 次免费检测机会,足够日常使用。
这里我们提前让 Kimi 生成一段人工智能的入门介绍,上传文本后,看看测试效果。
果然不出所料,朱雀检查下来的 AI 率:100%
系统还能生成详细报告,让你看清每一段的检测结果。
二)ZeroGPT
虽然朱雀大模型也支持检测英文,但是有另外一款免费且专业的英文检测平台:ZeroGPT。
地址:https://www.zerogpt.com/
这款英文检测平台同样支持上传文件或粘贴文本两种检测方式,也支持导出 PDF 报告查看详细结果。
除了这些免费工具,还有许多更专业的付费工具。
写学术论文时,很多学校要求必须通过指定机构检测。国内常用的检测工具有 知网、维普、格子达,国外多用Turnitin 。
说到这儿,我真想替论文人吐槽一下:
且不说很多学校要求 AIGC 率不得高于 30%,最近有位网友告诉我,他们学校 甚至要求 AIGC 率为 0 %。
我想问:这种一刀切做法真的合理吗?
作为外行的我,想说几句:
1、目前的 AIGC 检测多是黑盒算法,缺乏透明度和解释性。
2、用一个简单数字评判论文质量,是对学术的不尊重。
3、最讽刺的是:AI 训练数据本身就包含大量学术论文,硬要求"不像 AI "反而可能降低论文专业性。
但是学校要求了,不能不遵守吧?没办法,还得靠自己。
三、什么方法可以手动降低 AIGC 率
检测工具知道了,但问题来了:如何让 AI 写的内容不被检测出来?
想要降低 AIGC 率,就得重新聚焦于最开始的那两个词:困惑度、突发性。
在开始前,我做了个有趣的实验:把朱自清的《背影》放进朱雀里,结果 AI 率为 0%!
这不禁让我思考:经典文学作品为什么能"骗过"AI 检测器?
我们让 AI 来剖析下:
AI 分析结果如下:
结合 AI 的分析结果后,我们可以发现了几个 AI 难以模仿的关键特征:
一)打破情感的"均匀性"
朱自清笔下的情感流动自然且多层次,从悲伤到体谅再到自省,形成丰富的情感波澜。
而 AI 写作时,情感基调往往 始终如一 ,要么一直悲伤,要么全程客观。想降低 AI 味,就需要 在文章中设置情感起伏,忽高忽低才像真人。
二)打破用词的“标准性”
朱自清用“簌簌地流下眼泪”而不是“流泪“,用“光景很是惨澹”而不是“生活困难”,这些表达都很个性化。
AI 生成的文本倾向于使用最常见、最标准的表达方式。要降低 AI 味,需要 用更个性化、不那么“教科书”的表达。
三)打破结构的"完美性"
《背影》的结构并不完美,有些地方细节丰富(对父亲送行的描写),有些地方则一笔带过(卖家产还债)。
这种不均衡的关注点分配很符合人类思维。
AI 写作时往往结构严谨,各部分篇幅均匀,逻辑性极强,如果想要降低 AI 味,就需要 有意打破这种完美结构。
围绕上述分析和过去的一些经验,我总结了一些关键的技巧,可以帮助大家一定程度的降低 AIGC 率:
1.减少连接词的机械使用,:避免机械地使用如“首先”、“其次”、“再次”、“然而”等连接词,尽量使逻辑连接更自然、灵活。
2.删除过于规律的总分结构开头句,避免使用AI生成内容的常见模式,以减少被检测为AI生成的风险。
3.增加语义复杂性:适当使用隐喻、类比和修辞手法,使文本更贴近人类自然写作习惯。
4.使用长句代替短句,保持原意不变的情况下增加部分信息使句子自然流畅。
5.在正式语言中突然插入口语表达,偶尔使用不完整句、感叹句。
无论如何,建议先仔细阅读原文,按照这些技巧进行逐句调整,一定要保持耐心~
四、什么工具可以批量降低 AIGC 率
如果大家有一定预算,想要提高效率,可以使用我们最近刚研发的产品进行批量处理。
先给大家秀一波部分客户使用后收到的好评。
我们的工具可以用来干嘛呢?
✅ 中文 AIGC 率显著降低,稳定通过所有主流检测平台
✅ 英文版本内测中
让我来进行一次演示:以刚才 AI 生成的人工智能介绍文本为例,通过我们平台处理后的效果也非常不错。
第一步:使用浏览器(推荐谷歌、火狐)打开平台:https://jayliu.site/rewrite
第二步:选择语种、平台、提交方式,填写密钥。
第三步:提供需要改写的文本,等待改写完成。
朱雀大模型检测结果: AI 痕迹彻底消除,检测率为 0%
有人可能说朱雀大模型不够专业,不满足要求。
没事,我们拿到知网来测试下,同样显示 0 %的 AIGC 率。
当然,我们不会只验证几篇 Demo 就匆匆上线。
在对外公开前,团队对数百篇不同类型的文章进行了测试,确保系统在各种场景下的稳定性和有效性。
以下是部分真实测试数据:
✅ 一键上传,原格式无损转换
左侧为原稿,右侧为一键上传改写后的文稿。
保留摘要标题、关键词、英文摘要:
保留正文标题,只改写了正文,正文中也保留了脚注,且字体、字号前后也一致。
保留图片:
保留参考文献:
此外,还支持保留 表格、附录、封面 等等内容。
说直白点,只调整需要改写的内容,且标记红色,其他内容和格式基本上不会发生改动。
✅ 最新升级,文字降重功能
最近刚刚上线的文字降重功能,支持各大主流平台 降低到 30% 以下。
以下是部分平台的验证截图:
由于 AI 的随机性,我们很难承诺 100% 达到预期,但是前面客户的评价,就已经佐证了我们工具的价值。
这些成果,来自团队无数次加班和熬夜,更离不开很多客户的耐心反馈,非常感激他们。
说实话,我们的产品还存在不少 Bug、UI 设计也不够精美,但是我们一直用心在替用户解决问题。
五、文末福利
最后想说——
深夜里的焦虑,我们都曾经历过。 论文被打回的绝望,我们都感同身受。
一遍遍修改却依然无效的崩溃,我不想让更多人体验。
人生已经够难了,何必再被一个冰冷的检测系统绊倒?
与其通宵达旦修到头秃,不如花几分钟智取"AI 检测"。
你的点赞和转发,也许能拯救一个正在崩溃边缘的论文人。
直达链接:https://jayliu.site/rewrite
目前处于功能内测中,现在扫码,送免费内测码,限量 50 人。送完即止。
六、小彩蛋
很多粉丝经常私聊我:“你的文章到底是不是 AI 写的?有时候怎么写得那么快 ~”
这次,终于等到这个自证清白的机会了!
事实上,纯 AI 生成的内容,不借助工具,或者消耗大量时间很难降低 AIGC 率。
但如果是人工创作的框架和核心观点,再借助 AI 做润色和表达优化,自然就能远离高 AIGC 率的困扰。
我自己就是这样做的。
这可能也是目前最有效的"降 AI"秘诀 ~
我是 🐼 熊猫 Jay,我们下次再见~