各类大模型能力评测(通义千问、Kimi、讯飞星火、GPT4)

绘画

通义千问


讯飞星火


Kimi以摆烂,故不演示

GPT4以摆烂,,故不演示

写作

本次写作题目为重庆市某次中考作文题目,具体如下

以下两题,选做一题。(55分) 要求:①不少于 500字;②凡涉及真实的人名、校名、地名,一律用 A、B、C等英文大写字母代替:③不得抄袭。

(1)阅读下面这首小诗,自选角度,自拟题目,写一篇文章。

圆也美,缺也美

明也好,隐也好

月,天天是一个全新的自我

(2)初中毕业后的暑假,父母希望你参加初高中衔接学习,而你想发展自己的兴趣爱好。你需要给父母写一封信,请求他们同意你的想法。 注意:①请在作文第一行居中写“给父母的一封信”:②文末署名“小渝”,时间为6月12日。

通义千问

讯飞星火

 Kimi

GPT4

编码

题目来源于:传送门

通义千问

答案

测试结果

讯飞星火

答案

测试结果

Kimi

答案

测试结果

GPT4

答案

 测试结果

数学能力

由于大模型回答篇幅过长,故将题目在此展示:

阅读材料,完成问题

对任意一个三位数n,如果n满足各位数字上的数各不相同,且都不为0,那么成这个数为"相异数",将一个"相异数"的任意两个数位上的数字对调后可以得到三个不同的新三位数,把这三个新三位数与111的和记作F(n)。例如n = 213,对调百位与十位上的数字得到213对调百位与个位上的数字得到321,对调十位与个位上的数字得到132,这三新三位数的和为:213 + 321 + 132 = 666,666 \div 111 = 6,所以F(123) = 6 

(1).计算:F(243) \text{ , } F(617)

(2).若s \text{ , } t都是"相异数",其中s = 100 \times x + 32 \text{ , } t = 150 + y(x \text{ , } y都是1 - 9的自然数),规定k = \frac{F(s)}{F(t)},对于F(s) + F(t) = 18时,求k的最大值

通义千问

答案

结果

第(1)小题:错误

第(2)小题:未作答

总评:正确率0 \%

讯飞星火

答案 

 结果

第(1)小题:半对

第(2)小题:错误

总评:正确率33.3 \%

Kimi

答案

结果

第(1)小题:错误

第(2)小题:未作答

总评:正确率0 \%

GPT4

答案

结果

第(1)小题:错误

第(2)小题:错误

总评:正确率0 \%

文案分析

文案摘自洛谷用户协议

通义千问

语言合理

讯飞星火

语言合理*2

Kimi

语言合理*3

GPT4

《自报家门》

数据抓取

抓取网站为宝玩小游戏合集

通义千问

搜索全部通过 

讯飞星火

 搜索全部不通过

 

 Kimi

 搜索全部通过

GPT4

 搜索全部不通过

综合结果

写作

讯飞星火 = 通义千问 > Kimi > GPT4

编码

讯飞星火 = GPT4 > Kimi  >  通义千问 

数学

讯飞星火>GPT4 = Kimi = 通义千问

数据抓取

Kimi=通义千问>讯飞星火=GPT4

对于绘画,文案分析等主观内容,本文不做过多评价

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值