在文心一言超越ChatGPT3.5后,我们做了大模型对比测试。

 

IDC发布的AI大模型评估报告中,文心一言拿下12个指标中的7个满分,综合评分第一。百度副总裁吴甜表示,新版文心一言已超越ChatGPT3.5。这是令人振奋的新闻。不过,我们还没能体验到文心一言。

除了文心一言,号称超过ChatGPT3.5大模型,还有google的bard,Meta的LlaMA2和claude2。我们来一一对比测试下。

将本文第一段,发给他们改写成震惊体。(点击图片,放大查看)

 google的bard

 

claude2

 

LlaMA2

 

ChatGPT3.5(ppword提供)

 

ChatGPT-4(ppword提供)

 

Llama2不能直接输出中文,后续要求输出中文,直接断开了。可能是第三方网站本身的问题。

可以看出,google的bard和claude2表现都非常不错。和chatGPT3.5确实接近了。体验过早期ChatGPT3.5的同学会知道,ChatGPT3.5之前也和bard和claude一样,废话很多。最近明显收敛了很多。

但是,他们所有人,都没法和ChatGPT-4相比。GPT-4是真的很强。我们尝试用GPT-4代替人工去各大内容平台(微信公众号,微博,小红书,知乎,bilibili等)发布内容。都获得非常不错的流量。把内容里明显的:‘虽然,但是,首先,其次’之类的固定格式去掉就可以了。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值