Claude3,超越 ChatGPT4 的新一代大模型

Claude3 来了,与 Claude 以往的版本不同,这个版本引起了轰动。

以前 Claude 给我的印象就是普普通通,没什么亮点,唯一让我印象深刻就是它的上下文比 GPT 长很多。

但 Claude3 不一样了,不再是小透明了,因为它超越了行业标杆 GPT4。

Claude3 是一个家族,包含3个版本:

Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus

能力依次增强,Opus 是最牛版。

目前 Claude 官网可以免费使用的是 Sonnet,Opus 是收费版,20美金一个月。

1. 性能

基准测试

这张图是 Claude 官网给出的多个模型基准测试对比。

可以看出,Opus 在各项测试中都超过了 GPT4,并且,有好几项都是大幅领先,这就难怪 Claude3 引起轰动了。

在这个图中,有两点让我很惊讶。

一是 MGSM 测试,Claude3 大幅领先不说,关键是数字下面的 shot 数,Claude3 是 0-shot,而 GPT4 是 8-shot,shot 是示例。

也就是说这项测试中,Claude3 没用示例,比 GPT4 用了8个示例还牛。

二是 Haiku 与 GPT3.5 的对比。

Haiku 是 Claude3 的最低配,居然比 GPT3.5 厉害。

长文本测试

这张图是 Opus 的长文本准确性测试。

Claude 3 Opus 在进行评估时不仅能够准确地回忆信息,还能够识别出可能存在的干扰或错误,包括人为插入的内容。这表明 Claude 3 Opus 在评估过程中具有一定的自我识别和纠错能力。

这项能力的提升可以说是飞跃,要知道,在 Claude 2.1 中,上下文超过 10K 时,准确率只有50%左右。

2. API 价格

API 价格也是我比较关心的。

以 1M tokens 为单位,

Opus 输入价格是 75。

GPT4 输入价格是 60。

GPT-4 Turbo 更便宜,输入价格是 30。

所以 Opus 在价格上没有优势。

Claude 3 性价比最高的是 Haiku 版本,不仅性能超过了 GPT3.5,而且更便宜。

Haiku 输入价格是 1.25。

GPT3.5 输入价格是 1.5。


Claude 3 已经正式步入了大模型产品的第一梯队,使我们有了更多的选择,我不会只将其作为备胎了,一定会更频繁的使用。

#Claude3,#ChatGPT4,#人工智能,#gpt890,#Prompt提示词

来源 gpt890.com/article/23

  • 21
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值