让AI写高考作文:GPT-4、Kimi、通义千问“创意写作”能力横向测评!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

一些结论

模型文章字数文章特点优点不足
GPT-4o1193内容丰富,结构严谨,逻辑清晰提供了具体的例子和深入的分析深度仍有提升空间
GPT-4 Turbo911文章简洁流畅,结构清晰,逻辑严密满足要求,行文流畅深度稍有欠缺
Kimi Chat871行文流畅,表达清晰准确理解题意每部分论述较浅,缺乏深度和具体论据,内容不如前两者充实,字数较少
通义千问812字数最少,提供实用的解决方案和方法,侧重实际建议准确理解题意论述浅显,缺乏深入分析和具体例证,需要进一步挖掘原因和影响


创意写作是LLM模型最擅长的基本功之一。大家熟知的GPT全称为Generative Pre-trained Transformer,意为生成式预训练Transformer架构的模型。这里的“生成式”指的就是这类LLM模型能够生成新的文本内容,而不仅仅是进行分类、标注或预测。生成式模型能够根据输入的提示和上下文,生成相关的连贯文本。这种生成能力使GPT模型在处理开放性任务和需要创造性思维的任务时表现出色,例如生成文章、续写故事、编写代码、创作诗歌等。

今天我们要测评的便是创意写作能力,测评的主角为OpenAI的GPT系列模型,包括GPT-4oGPT-4 Turbo,国内AI领域的网红Kimi Chat以及阿里的通义千问。本次测评统一使用中文提示词,虽然可能对国外模型不是很公平,但正好也能测试一下GPT模型对中文的友好程度。

测评问题

本次的测评问题我们选用2023年高考语文全国甲卷作文:《人·技术·时间》。

题目

阅读下面的材料,根据要求写作。

人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。

这句话引发了你怎样的联想与思考?请写一篇文章。

要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。

全国甲卷《人·技术·时间》这道作文题目相对比较抽象,对思维能力和思考深度的要求较高。对于AI模型来说,首先难点在于准确理解题目的意思,其次需要从某一角度/观点切入生成文章。

在测评中,统一只使用原题目作为提示词,力求测试各模型的理解能力,不给AI模型过多的引导或者介绍。

GPT-4o

GPT-4o的回答

掌控时间还是被时间掌控:技术发展的两面性

技术的发展,无疑为人类社会带来了诸多便利。现代科技尤其是在时间管理方面的进步,赋予了我们前所未有的掌控力。智能手机、日历应用、在线会议工具,这些技术手段使我们能够更高效地安排和利用时间。然而,值得深思的是,这些便利是否真的让我们更好地掌控了时间?还是我们在不知不觉中,成为了时间的仆人?

技术让我们更高效

不可否认,技术的发展使我们在时间管理上有了更多选择和更大自由。例如,电子邮件和即时通讯工具的普及,使得沟通效率大幅提升。人们可以随时随地处理工作事务,无需像过去那样等待数日才能收到回信。线上会议平台的兴起,更是打破了地域限制,使得跨国合作和远程办公成为可能。这些技术手段极大地提高了我们的工作效率,让我们能够在更短的时间内完成更多的任务。

此外,智能化的时间管理工具也在个人生活中发挥了重要作用。日历应用不仅可以帮助我们记录重要事项,还能提前提醒,避免遗忘。健康类应用则通过记录和分析我们的作息习惯,帮助我们更好地规划时间,保持良好的生活节奏。可以说,技术的发展确实在一定程度上帮助我们更好地掌控了时间。

被时间绑架的隐忧

然而,随着技术的发展,我们也越来越频繁地感受到时间的压力和束缚。智能手机的普及,使得我们随时随地都在“在线”,工作与生活的界限变得模糊。许多人在下班后依然无法摆脱工作的侵扰,随时可能收到邮件或消息,需要立即处理。这种随时在线的状态,虽然提高了效率,但也无形中让我们成为了时间的仆人,被工作和事务所绑架。

此外,社交媒体的兴起也让我们在无形中浪费了大量时间。短视频、朋友圈、微博等平台吸引着我们的注意力,使我们在不知不觉中花费了大量时间在无意义的浏览上。尽管这些平台带来了娱乐和放松,但也让我们变得更加分心,难以专注于真正重要的事情。技术带来的信息过载和注意力分散,进一步加剧了我们对时间的焦虑和无力感。

如何平衡技术与时间的关系

面对技术发展的两面性,我们需要审慎地思考如何在享受技术便利的同时,不被其所累。首先,我们需要学会设置界限。在工作与生活之间划出明确的分界线,不让工作侵蚀私人时间。可以通过设定固定的工作时间和休息时间,避免在下班后继续处理工作事务,从而保证自己的休息和放松。

其次,我们需要培养专注力,学会抵御技术的干扰。可以尝试减少对社交媒体的依赖,设定每日的使用时限,避免在无意义的内容上浪费过多时间。同时,通过培养兴趣爱好和参加现实中的社交活动,来丰富自己的生活内容,减少对虚拟世界的依赖。

最后,我们需要善用技术,真正实现对时间的掌控。例如,利用时间管理工具来规划和记录每天的任务,合理安排时间,提高效率。同时,通过健康类应用来监测自己的作息,保持良好的生活习惯,从而在身体和心理上都保持最佳状态。

结语

技术的发展为我们提供了前所未有的便利,使我们能够更好地掌控时间。然而,技术的双刃剑效应也提醒我们,在享受这些便利的同时,需要警惕被时间绑架的风险。只有在技术和时间的关系上找到平衡点,我们才能真正实现对时间的掌控,而不是成为时间的仆人。通过合理利用技术,设定界限,培养专注力,我们可以在现代社会中过上更高效、更健康、更有意义的生活。

点评

字数:1193。

总体来看,GPT-4o准确地理解、把握住了题目的三个核心元素:人、技术、时间。按照引言、主体和结论的格式展开,详细论证了技术对时间管理的正反两方面影响。逻辑清晰,结构分明,符合常见的议论文结构。GPT-4o的文章也提到了具体的例子,如电子邮件、即时通讯工具和社交媒体,展示了技术如何提高效率,同时也指出了它带来的隐忧。

不足之处:虽然文章的逻辑已经很清晰严谨了,但在深度分析方面还可以进一步提升。

GPT-4 Turbo

GPT-4 Turbo的回答

标题:技术的双刃剑:我们真正掌控了时间吗?

在这个迅速变化的时代,技术的发展无疑为我们的生活带来了前所未有的便利。智能手机、网络通讯、人工智能,这些都极大地丰富了我们处理信息、进行社交以及解决问题的方式。表面看来,这些技术的确帮助我们节省了大量时间,使我们能够更高效地处理日常任务和工作需求。然而,正如一枚硬币永远有两面,技术对时间的掌控也带来了一系列的副作用,使一些人变成了时间的奴隶。

首先,技术的高速发展确实提升了生活与工作的效率。过去,一封信需要数天甚至数周才能送达,现在,一条电子邮件或即时消息几秒钟就能完成传递。网络会议的普及使得人们不再需要长途跋涉去参加会议,几乎可以在任何有网络的地方进行面对面的交流。此外,人工智能和自动化技术的应用,如智能家居和自动化工厂,极大地解放了人们的双手,减少了重复和体力劳动的需求。

然而,技术带来的便利性也伴随着对个人时间的无形侵蚀。智能设备和社交网络的普及,使得工作和生活的界限变得模糊。人们随时随地都可能接收到工作相关的信息和要求,加班成为了常态而不是例外。例如,晚上和周末本应是个人休息的时间,现在却常常被工作邮件和紧急会议填满。此外,虽然社交网络使人与人之间的联系更加紧密,但它也在无形中消耗了大量的个人时间,人们在不知不觉中花费大量时间在浏览信息流、更新状态和回复消息上。

更重要的是,技术的普及改变了人们对时间的感知和使用方式。在信息爆炸的今天,人们往往处在持续的信息接收和处理状态中,这不仅导致了注意力的分散,也可能引起压力和焦虑。技术的便捷使我们可以在短时间内接触到大量信息,但这也使得我们很难深入地思考和消化这些信息。我们变得习惯于快速浏览而不是深度阅读,习惯于即时反应而不是深思熟虑。

因此,我们需要重新审视技术与时间的关系,并学习如何在这个高速发展的技术环境中找到平衡点。首先,个人需要意识到自己的时间是有限且宝贵的,应当学会对各种技术工具说“不”,合理规划自己的时间和精力。其次,企业和组织也应当鼓励和实施更加人性化的工作制度,比如灵活的工作时间和空间,以及对员工的信息处理能力和工作压力的合理期待。

总之,技术本身并非善也非恶,关键在于我们如何使用技术。只有当我们真正成为时间的主人,而不是技术的奴隶,才能真正享受技术带来的便利和高效。在这个快速发展的世界里,保持对时间的敏感和掌控,才是对抗技术侵蚀的最好方式。

点评

字数:911。

GPT-4o一样,GPT-4 Turbo也准确地理解了题目意思,甚至上面两篇文章的中心思想和主要观点都是一致的。GPT-4o生成的文章更长,比GPT-4 Turbo多200多字,但也都满足了“不少于800字”的要求。

单从GPT-4 Turbo的这篇文章来看,文章结构清晰,从技术的便利性到隐忧,再到建议,层层递进,逻辑严密,行文流畅,语言简洁明了,有较强的说服力。

不足之处:和GPT-4o生成的文章一样,整体框架和逻辑不错,但深度上还有所欠缺。

Kimi Chat

Kimi Chat的回答

标题:时间的双刃剑:技术与自由

在人类文明的长河中,技术的发展一直是推动社会进步的引擎。从蒸汽机到互联网,技术革新不仅改变了我们的生活方式,也极大地扩展了我们对时间的掌控能力。然而,正如硬币的两面,技术的进步在赋予我们自由的同时,也带来了新的束缚。本文将从技术与时间的关系出发,探讨技术如何成为时间的双刃剑。

一、技术:时间的解放者

技术的发展让我们能够更高效地利用时间。在农业时代,人们日出而作,日落而息,时间的利用受到自然条件的极大限制。进入工业时代,机器的广泛使用使得生产效率大幅提升,人们开始有了更多的闲暇时间。到了信息时代,互联网和移动通信技术的发展,更是让信息的获取和交流变得即时和便捷,极大地缩短了时间距离。

二、技术:时间的新主人

然而,技术的进步也带来了新的问题。在数字化时代,我们似乎无时无刻不被各种设备和应用程序所绑架。智能手机、社交媒体、电子邮件和即时通讯软件等,它们不断地提醒我们有新的消息、更新和通知,让我们难以从这些数字世界中抽身。我们的时间被切割成无数碎片,我们开始为了回复一条信息、刷新一次动态而牺牲休息和思考的时间。

三、时间的自主权

面对技术的双刃剑效应,我们需要重新审视和掌握时间的自主权。首先,我们应该学会合理规划时间,将技术作为工具而不是主宰。例如,我们可以设定每天的“无干扰时间”,在这段时间内关闭所有通知,专注于工作或学习。其次,我们应该培养自我控制能力,不被技术的即时反馈所诱惑,学会延迟满足,享受深度工作和思考的乐趣。

四、平衡的艺术

技术与时间的关系,本质上是一种平衡的艺术。我们不能因为技术的负面影响就全盘否定它,也不能盲目追求技术的便利而忽视了时间的价值。我们需要在享受技术带来的便利的同时,保持对时间的尊重和珍惜,找到技术与自由之间的平衡点。

五、结语

技术的发展是不可逆转的趋势,它将继续深刻影响我们对时间的掌控。作为个体,我们应该积极适应这一变化,学会在技术的帮助下更好地管理时间,而不是成为时间的仆人。只有这样,我们才能在技术的浪潮中保持自我,享受真正的自由。

通过以上分析,我们可以看到,技术既是时间的解放者,也是时间的新主人。关键在于我们如何使用技术,如何平衡技术与时间的关系,最终实现对时间的自主掌控。这不仅是一个技术问题,更是一个哲学问题,需要我们不断地思考和实践。

点评

字数:871。

和GPT系列模型生成的文章相比,给我的感觉,Kimi Chat更像是一名文科生,行文流畅,表达清晰,而GPT-4oGPT-4 Turbo则更像是逻辑严谨的理科生,写出来的文章一板一眼,更注重逻辑。

但就文章的内容充实度和深度来说,Kimi Chat则远不如以上两篇文章,甚至比GPT-4o少写300多字。文章被分为了5个小部分,导致每一部分只能是泛泛而谈,缺乏足够的论据支撑和深度。

通义千问

关于通义千问多说几句,之前我写过一篇文章详细介绍通义千问:阿里发布通义千问2.5:一文带你读懂通义千问!。有小伙伴问怎么能用上通义千问2.5版本,很简单,直接登录通义千问官网就是2.5版本了。

通义千问的回答

标题:做时间的主人,而非仆人

在科技日新月异的今天,人类利用各种技术手段极大地提高了生活的效率,仿佛成了时间的主宰。然而,反观我们的生活,是否每个人都能理性地运用技术,真正成为时间的主人呢?恐怕不尽然。不少人反而沦为了时间的仆人,被各种电子设备、社交网络、即时通讯工具所奴役,失去了自由,忘记了生活的本质。

首先,我们应当认识到,技术的发展本是为了服务人类,提高生活质量,让人们有更多的时间去享受生活,追求精神上的富足。比如,智能手机让我们可以随时随地获取信息、处理工作,理论上应为我们节省了时间。但现实情况是,很多人对手机产生了过度依赖,无时无刻不在刷屏,无论是吃饭、走路还是睡前,都离不开手机的陪伴。这种行为不仅侵蚀了我们的私人时间,影响了人际关系,更导致了注意力分散、睡眠质量下降等一系列健康问题,使我们成为了技术的奴隶。

要做时间的主人,而非仆人,关键在于如何合理利用技术,找回生活的主动权。这要求我们在享受技术便利的同时,也要有意识地进行自我约束和管理。

  1. 设定界限:为使用电子产品设定明确的时间限制,比如工作时间外不查看工作邮件,晚上睡前一小时不使用任何屏幕设备,以减少对时间的无谓消耗。

  2. 专注当下:培养深度工作的习惯,将注意力集中于手头的任务,避免频繁切换任务导致的时间碎片化。可以通过断网、关闭不必要的通知等方式创造一个无干扰的环境。

  3. 质量时间:重视与家人、朋友面对面交流的时间,减少社交媒体上的虚拟互动。真实的人际交往能够提供情感支持,增强生活的满足感和幸福感。

  4. 自我反思:定期进行时间管理的反思,评估技术使用的利弊,调整生活习惯。可以尝试记录时间日志,了解自己的时间究竟花在了哪里,从而做出更有益的调整。

  5. 培养兴趣:鼓励自己探索和发展线下爱好,如阅读、运动、手工艺等,这些活动不仅可以丰富个人生活,还能有效减少对电子设备的依赖。

总之,技术本身并无好坏之分,关键在于使用者的态度和方法。只有当我们能够自觉地控制技术的使用,而不是被其控制,才能真正成为时间的主人,享受技术带来的便利,同时不失生活的品质和深度。在这个快节奏的时代,让我们学会放慢脚步,珍惜每一刻,活出自己的节奏,做时间的主人,而非仆人。

点评

字数:812。

首先,生成的文章最短,字数仅812字,勉强满足题目条件。同为议论文,但通义千问的回答主要侧重于具体的解决建议和方法,但由于字数的限制,每一条解决方案的论述略显浅显,应该可以进一步挖掘其背后的原因和更深层次的影响。

总结

首先可以确定的是,每个AI模型/工具都能够准确理解这道作文题目的意思。

就生成的文章而言,GPT-4oGPT-4 Turbo在文章结构和逻辑上表现出色,论证清晰且层次分明,GPT-4o在字数和内容丰富度上略胜一筹。Kimi Chat则展现了文科生般的流畅表达,但在内容深度略显不足。通义千问侧重于实际建议和方法,但具体论述略显浅显,缺乏更深入的分析和具体例证。

GPT-4oGPT-4 Turbo在逻辑严谨性和结构完整性方面表现最佳,适合需要深入分析和严谨论证的写作任务。Kimi Chat通义千问则对中文的适配性更好,适合需要流畅表达和清晰逻辑的场景。


精选推荐

  1. 使用GPT-4o模型的5种方法,总有一种适合你!

  2. 关于最新模型GPT-4o的14条总结,都在这里!

  3. 免费的GPT4终于要来了!OpenAI直播发布会详细解读!

  4. 春日暖阳,何不来看一场OpenAI的发布会


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值