Claude3，超越 ChatGPT4 的新一代大模型

最新推荐文章于 2025-06-13 10:17:23 发布

TechAI

最新推荐文章于 2025-06-13 10:17:23 发布

阅读量1.1k

点赞数 21

文章标签：人工智能 chatgpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TechAI/article/details/136497761

版权

Claude3 来了，与 Claude 以往的版本不同，这个版本引起了轰动。

以前 Claude 给我的印象就是普普通通，没什么亮点，唯一让我印象深刻就是它的上下文比 GPT 长很多。

但 Claude3 不一样了，不再是小透明了，因为它超越了行业标杆 GPT4。

Claude3 是一个家族，包含3个版本：

Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus

能力依次增强，Opus 是最牛版。

目前 Claude 官网可以免费使用的是 Sonnet，Opus 是收费版，20美金一个月。

1. 性能

基准测试

这张图是 Claude 官网给出的多个模型基准测试对比。

可以看出，Opus 在各项测试中都超过了 GPT4，并且，有好几项都是大幅领先，这就难怪 Claude3 引起轰动了。

在这个图中，有两点让我很惊讶。

一是 MGSM 测试，Claude3 大幅领先不说，关键是数字下面的 shot 数，Claude3 是 0-shot，而 GPT4 是 8-shot，shot 是示例。

也就是说这项测试中，Claude3 没用示例，比 GPT4 用了8个示例还牛。

二是 Haiku 与 GPT3.5 的对比。

Haiku 是 Claude3 的最低配，居然比 GPT3.5 厉害。

长文本测试

这张图是 Opus 的长文本准确性测试。

Claude 3 Opus 在进行评估时不仅能够准确地回忆信息，还能够识别出可能存在的干扰或错误，包括人为插入的内容。这表明 Claude 3 Opus 在评估过程中具有一定的自我识别和纠错能力。

这项能力的提升可以说是飞跃，要知道，在 Claude 2.1 中，上下文超过 10K 时，准确率只有50%左右。

2. API 价格

API 价格也是我比较关心的。

以 1M tokens 为单位，

Opus 输入价格是 75。

GPT4 输入价格是 60。

GPT-4 Turbo 更便宜，输入价格是 30。

所以 Opus 在价格上没有优势。

Claude 3 性价比最高的是 Haiku 版本，不仅性能超过了 GPT3.5，而且更便宜。

Haiku 输入价格是 1.25。

GPT3.5 输入价格是 1.5。

Claude 3 已经正式步入了大模型产品的第一梯队，使我们有了更多的选择，我不会只将其作为备胎了，一定会更频繁的使用。

#Claude3，#ChatGPT4，#人工智能，#gpt890，#Prompt提示词

来源 gpt890.com/article/23

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。