IDC发布的AI大模型评估报告中,文心一言拿下12个指标中的7个满分,综合评分第一。百度副总裁吴甜表示,新版文心一言已超越ChatGPT3.5。这是令人振奋的新闻。不过,我们还没能体验到文心一言。
除了文心一言,号称超过ChatGPT3.5大模型,还有google的bard,Meta的LlaMA2和claude2。我们来一一对比测试下。
将本文第一段,发给他们改写成震惊体。(点击图片,放大查看)
google的bard
claude2
LlaMA2
ChatGPT3.5(ppword提供)
ChatGPT-4(ppword提供)
Llama2不能直接输出中文,后续要求输出中文,直接断开了。可能是第三方网站本身的问题。
可以看出,google的bard和claude2表现都非常不错。和chatGPT3.5确实接近了。体验过早期ChatGPT3.5的同学会知道,ChatGPT3.5之前也和bard和claude一样,废话很多。最近明显收敛了很多。
但是,他们所有人,都没法和ChatGPT-4相比。GPT-4是真的很强。我们尝试用GPT-4代替人工去各大内容平台(微信公众号,微博,小红书,知乎,bilibili等)发布内容。都获得非常不错的流量。把内容里明显的:‘虽然,但是,首先,其次’之类的固定格式去掉就可以了。