Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

GPT-4真的被反超了!

大模型竞技场上,Claude 3大杯Opus新王登基,Elo分数来到榜首。

20857e45f808b1119ba276ff3ec2a3bc.png

连小杯Haiku也跻身第二梯队,超过了GPT-4-0613这个型号,把GPT-3.5-turbo远远甩在身后。

0501f7516104be4c4a194b9320b8aea5.png

Haiku的输入token价格,可是比GPT-3.5-turbo还便宜了一半,输出方面,每100万token也比GPT-3.5-turbo便宜近2块钱。

5e30bf3206369ddf57d7ad2bd8041b90.png

跟GPT-4相比,价格更是只有1/20。并且Haiku同样支持200k上下文。

855afa79d266499c598573fec7297ddd.png

难怪有开发者直言:

GPT-3.5在Claude Haiku面前不堪一击。

不仅仅是价格更便宜,Haiku还更上一层楼了。

eb1854f33c22e12b4cb49b9e493c4028.png

而在Claude 3加入竞技之前,GPT-4家族已经霸榜快一年了。

c62636785641e3e0be0705ab53d7a53b.png

给新来的朋友补充一下背景知识:大模型竞技场榜单(LMSYS Chatbot Arena Leaderboard)的评分标准是人类打分,同一个问题同时抛给A、B两个模型,人类裁判觉得哪个回答得好就给哪个投票。

小杯Haiku成开发者新宠

值得一提的是,在竞技场官方贺电中,Haiku这个型号也被专门高亮了出来:

根据我们的用户偏好,Claude 3 Haiku达到了GPT-4级别。

其速度、功能和上下文长度在目前的市场上是独一份的。

0cb79094b6137d2a26972e8a0dfcaa87.png

具体有多快,已经有网友做了个直观的对比:

博尔特还没跑完100米,Haiku已经读完100k token的文档了……

35b375d517cf4a42125cc052b04a603f.png
531d7649e4cd486cab46ea3da40a97de.gif

事实上,凭借其超高的性价比,在开发者社群中,Claude 3小杯Haiku确已成新宠。

已经有人第一时间大开脑洞,搞出了能让Haiku效果“超频”到大杯Opus水准的开源项目,吸引不少关注。

cce82b8d979ca7d94e1c8980b59541c3.png

简单来说,就是让Opus给Haiku当老师

先用Opus生成执行任务的范例,再用这些教学案例来提高Haiku的姿势水平。

划重点:Haiku的价格仅为Opus的1/60,而响应速度则是Opus的10倍。

这个名为gpt-prompt-engineer的项目目前在GitHub上累计揽下7.3k标星。

baadce5b6458c8c1fa691d465b513428.png

还是这位马特老哥,还用Opus和Haiku搞了个“AI股票分析师”,直接火上了GitHub热榜。

87b1d54311b5d35974a6f0cb4aa05f94.png

不少应用产品也在第一时间接入了Haiku。比如能依据Prompt自动生成网站UI的Vercel。

33115ad2775593989e904216a1a56dfa.gif
就说快不快吧

不过,就在一片给Claude 3新王点赞的声音中,也有网友认为:

GPT-3.5作为一个“老”模型,至今仍在与最新的模型竞争,这件事本身就很疯狂了。

fdf2773fd19bff29962f6ad27d0390cc.png

但最让开发者们期待的当然还是:

e9d26925d381ab0c6e7841aa08424634.png

OpenAI,快起来卷(doge)。

860bdff0776e05a13edeb6806b2d81b6.gif

评选报名即将截止!

2024年值得关注的AIGC企业&产品

量子位正在评选2024年最值得关注的AIGC企业、 2024年最值得期待的AIGC产品两类奖项,欢迎报名评选!评选报名 截至2024年3月31日 124d8548a250a649cfeed93667e8907d.png

69b69ae1a0cc4e25b069a2698804bb13.png

中国AIGC产业峰会「你好,新应用!」已开启报名!点击报名参会 同时,峰会将进行线上直播 ⬇️

点这里👇关注我,记得标星噢

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值