把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

明敏 萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI

高考刚过去不久,就有AI来“挑事”了。

这不,有个AI读完了毛选和鲁迅全集后,大笔一挥,写下好几篇高考作文。

结果……竟然还可以?

我们直接看文章:

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

看看这字里行间的青春与朝气,根本看不出是AI写的啊!

还能紧跟时事,“民族伟大复兴”这样的热点词用得游刃有余。

引经据典也不在话下:

一句“实践是检验真理的唯一标准”,立刻让文章高大上了起来。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

一眼望去,通篇全是踩分点

让人不禁猜想:难道AI写作文终于狗屁通了?

吃瓜群众也非常好奇:这样的文章到底能拿多少分?

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

既然如此,不如就让我们来当一次改卷老师,看看这个AI到底能拿多少分。

考场作文套“模板”利器

首先摆在AI面前的是2021年全国甲卷的考题,主题是“可为与有为”,具体题面如下:

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

AI一上来的表现就不俗,《青年代表说》这主题就令人直呼“高啊”。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

在题目中并没有提到“青年”二字的情况下,AI居然还能找到这样的切入点,这有点看头啊?

而且它还很鸡贼,开头直接抄了题目中的内容,这就叫“点题”。

甚至连我们写作文必备法宝——排比,它都用得游刃有余。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

三大段排比,情绪逐层递进还能凑字数。

而且作者@图灵的猫介绍,这种排比句式是AI直接生成的,并没有二次调整。

这可能是因为AI在训练过程中“记住”了这种语法结构,就运用了起来。

再看看结尾,这也是高考作文的重头戏。

AI依旧熟知我们的套路,一通拔高、升华,让改卷老师都不好意思打低分(不是)。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

这么看来,AI真的能写出让人满意的考场作文了?

话先别说太早,因为在之后的两套题里,它的表现就有些不尽如人意了。

首先要吐槽的,就是它每一次写作文,都会用抄题目的方法来凑出开篇。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

其次,它虽然使用了金句技能,马克思主义理论、李白诗句用得飞起,但是在文章的逻辑处理上,依旧不太行。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

比如“是否拥有以后一辈子的生命”,这句话显然不是中文的逻辑。

简称不说人话

而且它写出来的内容,总是在金句和废话之间徘徊。

就像下面这一段内容,每一句话单拿出来看都还可以,但是连成一段后,怎么又有点狗屁不通那味儿了?

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

此外,不知道是不是因为读了《鲁迅全集》的缘故,AI好像有点搞不懂我们现在的时代背景了。

这一段中的“三十载已过”,也是个令人有些摸不着头脑的时间概念。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

有网友总结了一下自己的感受:

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

挑战一下鲁迅的题目

本着看热闹不嫌事大的原则,光看现有案例怎么够,我们当然要上手试一下它的水平究竟如何。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

既然是读过《鲁迅全集》的AI,那我们就让它根据鲁迅的名言写一篇文章。

愿中国青年都摆脱冷气,只是向上走,不必听自暴自弃者流的话。能做事的做事,能发声的发声。

这段话大家一定耳熟能详,那让AI以此为题写一篇作文,画风会是啥样?

按照它的套路,开篇还是抄题目,所以我们直接来看第二段。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

AI直接提出了青年人要自信的主题,看来《鲁迅全集》没有白读,对于题目的理解还是很到位的。

之后的内容则对题面做了更加直白的解释,告诫青年要努力啊!奋斗啊!

看得我直呼别骂了…

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

接下来也是常规操作了,梅花香自苦寒来,金句一出、逼格拉满。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

文末还回到了现实生活,呼吁青年要着眼当下,才能有更美好的未来。

同时还加入了科技创新、大国崛起的要点。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

由此可见,AI写作文在把控主题上可以说是so easy。

考虑到真实的高考作文题目中,有许多都是设问再回答,所以我们也试了试给AI一个问句,会发生什么。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

在拿到文学应当如何改良?这样的命题后,AI很自然地说了句套话。

这第一段看上去非常具有哲理性,但究其本质,就是车轱辘话罢了。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

这样的问题在其他生成的文章中也十分常见,而且还会冒出来错别字、语病等小毛病。

与此同时,我们还发现它似乎不太能承受住奇葩一点的题目…

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

在把一道网传的奇葩作文题目交给AI后,它直接写出来了一篇意识流。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

这还只是第一段,后面的内容还出现了红色气球、子弹、龙牙、警察等等让人完全摸不着头脑的内容。

不止是奇葩题目,在涉及“古人”的题目时,AI还会冒出一两句奇形怪状的文言文来:

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

果然,还是现代主题的高考作文更适合AI发挥。

网友神总结:这就是个狗屁稍通文章生成器。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

5大模块,读题作答“一条龙”

上面这些偶尔“超常发挥”、平均挣扎在及格线上下的文章,源自一个名为EssayKiller的AI写作框架,本质上是个多模块异构深度神经网络。

据模型作者@图灵的猫表示,这个AI生成文章有点“捉襟见肘”的原因,也是因为采用的模型不是最先进的。

由于经费不足更好的模型没有开源,因此只能用GPT-2来生成文字,如果能用上GPT-3和华为盘古,效果肯定比现在更好。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

据了解,EssayKiller基于OpenCV开发,参数量达到17亿

从结构上看,这个AI框架主要包括5部分:输入、识别网络、语言网络、判分网络和输出。

相当于我们平时的“5步写作文”:拿到试卷、看题、打草稿、错误检查、写答题卡。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

其中,看题、打草稿和错误检查几个模块,都会被拿出来单独训练,各司其职。

看题部分,EssayKiller首先采用了OpenCV的EAST文本检测器,能以13帧/秒的速度,扫描任意方向、大小的720p图片文本,并将其中的文字检测出来。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

然后用OCR模型中的CRNN,对这些文字进行识别。

例如,将上面这张图片中的文字,转换成能直接输入模型的文本信息:“三写作70分……”

至于打草稿部分,则分为阅读理解、文本联想两部分,分别由BERT和GPT-2来完成。

BERT会将接收到的句子信息进行拆分、打碎,提取其中的关键词来,并将这些“必须出现在内文”的关键词交给GPT-2;

GPT-2在收到关键信息后,就能根据要求开始“大做文章”,每句话都与关键词密切相关,无时无刻不在“点题”。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

但GPT-2生成的文章,还不符合高考作文的标准。

要想让这些句子看起来流畅成段,还得筛去一批真·狗屁不通的病句,并检查句子中的拼写错误、机翻等问题。

这就是错误检查部分,EssayKiller直接调用了百度模型DNN的API,主要原理是对句子中的词语进行分析,并判断它们是否处在正确的位置上。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

在这3大关键步骤完成后,就可以正式排版成答题纸的格式,并用手写机器人输出了(相关模型也是开源的)。

看起来不错,已经有网友迫不及待想拿来写小作文了:

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

打住!

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

据@图灵的猫表示,不希望有人用EssayKiller来写作业,因此并没有开源相关参数设置,colab的调用次数也有严格限制。

要是出现违规行为,可能整个开源项目都会被关闭,同时也没法用Colab在线体验了。

到底“消化”得怎么样?

@图灵的猫介绍说,要想让AI模型写出这种效果的作文,在“语言生成模块”的训练集中,毛选和鲁迅全集等著作占比要超过10%

而模型的其他训练资料,则主要来源于开源中文散文数据集、高考作文数据集等。

那么,训练出的模型效果,是否符合预期呢?

不少网友表示,感觉AI还是“读进去了一部分”的:

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

而对于作者@图灵的猫来说,生成作文的质量也确实“比自己预期要好一些”。

但这并不表明,AI就已经能100%写出像样的高考作文了。

毕竟,最终呈现出来的几篇高考作文,都是在语言生成模型后,经过机器判分+人工筛选,才展示在读者面前的。

而在作文中所呈现出的排比等高级修辞手法,也只能说明训练语料中包含这类修辞,而AI模型在学习的过程中“记忆”了它们,并不能说明已经学到了这些手法。

把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了

换而言之,这次的AI模型,效果确实超乎预期,但并不意味着它真正“消化”了这些语料。

那么,这个AI模型接下来还会试些什么?

@图灵的猫表示,下一步的目标是“科幻小说”:

要是有空的话,我会将大刘、阿西莫夫和阿瑟克拉克等科幻作家的作品加入训练集,让AI模型试试写科幻小说。

嗯,AI写作开始有点赛博朋克那味了。

欣赏了毛选和鲁迅文集的开源AI模型:
https://github.com/EssayKillerBrain/EssayKiller_V2

Colab版在线生成器:
https://colab.research.google.com/github/EssayKillerBrain/EssayKiller_V2/blob/master/colab_online.ipynb

参考视频(已授权):
https://www.bilibili.com/video/BV1aw411f7G9

— 完 —

内容概要:2025年大宗商品市场展望报告由世界银行发布,分析了能源、农业、金属矿物、贵金属以及化肥等多个主要商品类别的市场发展与前景。报告指出,由于全球经济增长放缓贸易紧张加剧,2025年大宗商品价格预计总体下降12%,2026年进一步下降5%,达到六年来的最低点。油价预计2025年平均为每桶64美元,2026年降至60美元,主要受全球石油消费放缓供应增加的影响。农业商品价格预计2025年基本稳定,2026年下降3%,其中粮食原材料价格分别下降7%2%,但饮料价格上涨20%。金属价格预计2025年下降10%,2026年再降3%,特别是铜铝价格将显著下跌。贵金属如黄金白银因避险需求强劲,预计价格将继续上涨。报告还特别关注了疫情后大宗商品周期的变化,指出周期变得更短、更剧烈,主要受到宏观经济冲击、极端天气事件地缘政治冲突的影响。 适用人群:对全球经济趋势、大宗商品市场动态及其对不同经济体影响感兴趣的政策制定者、投资者、分析师及研究机构。 使用场景及目标:①帮助政策制定者评估全球经济增长放缓对大宗商品市场的影响,从而调整经济政策;②为投资者提供有关未来大宗商品价格走势的风险提示,以便进行投资决策;③协助分析师研究机构深入理解疫情后大宗商品市场的周期特征,识别潜在的投资机会风险。 其他说明:报告强调,全球经济增长放缓、贸易紧张加剧以及地缘政治不确定性是影响大宗商品价格的主要因素。此外,极端天气事件能源转型也对农业能源商品市场产生了深远影响。报告呼吁各方关注这些结构性变化,并采取相应的风险管理措施。
内容概要:《薪智-2025汽车销售行业白皮书:人力核心指标行业报告系列》详细分析了2025年中国汽车销售行业的人力资源核心指标。报告涵盖多个维度的数据,包括样本分布、涨薪率、离职率、应届生起薪、城市薪酬差异系数、人力需求、招聘趋势、热门职能、福利洞察以及热门岗位薪酬。通过对不同城市、不同职能不同企业的分析,报告揭示了行业内的薪酬变化趋势、招聘动态人才流动情况。特别关注了涨薪率的变化,发现2024年汽车销售行业的涨薪率为2.5%,而2025年的预测为0.7%。此外,报告还展示了不同城市的薪酬差异,如上海的薪酬差异系数为122.7%,而贵阳则为71.8%。报告还指出,近一年来,汽车喷漆、销售代表、新媒体运营等职能的招聘量薪酬变化较为显著。 适合人群:汽车行业从业者、人力资源管理者、招聘经理、企业决策层。 使用场景及目标:①帮助企业管理者制定合理的薪酬策略;②为人力资源部门提供招聘留才依据;③为求职者提供行业薪酬职业发展参考;④为企业调整福利政策提供数据支持。 阅读建议:本报告数据详实,建议重点关注涨薪率、离职率、应届生起薪城市薪酬差异系数等关键指标,结合自身情况进行分析应用。同时,关注热门职能岗位的薪酬变化,有助于更好地把握行业发展趋势。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值