OpenAI最强竞对发布Claude 3,超过GPT-4

Anthropic 大模型公司今日重磅发布了其第三代人工智能(AI)模型 ——Claude 3 系列模型,包括 Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku 。每个模型都提供了不同程度的智能、速度和成本选择,旨在满足广泛的人工智能应用需求。

这三款模型在推理、数学、编码、多语言理解和视觉处理等方面相当扎眼。其中,Claude 3 Opus 为 Claude 3 系列模型的最强版本,具有接近人类的理解能力,可以灵巧地处理开放式提示和复杂的任务。

claude.ai 体验网址上,Claude 3 免费版用户使用 Sonnet 模型。而订阅用户将能够体验到更高级的 Opus 模型。

此外,Anthropic 团队还表示,Claude 3 系列模型解决了之前模型经常出现“不必要的拒绝”的问题。

Anthropic 官方宣称, Opus 模型智能程度堪比人类,能够游刃有余地应对开放式问题,并巧妙解决各种复杂挑战。

从官方发布的成绩单来看,在知识测试 MMLU、推理测试 GPQA、基础数学测试 GSM8K 等一系列基准测试中,超大杯 Claude 3 Opus 模型展现了卓越的性能,其每一项得分都全面超越了 GPT-4 以及 Gemini 1.0 Ultra。

Claude 3 系列模型的创新与优势

准确性的提高

与 Claude 2.1 相比,Claude 3 Opus 在具有挑战性的开放式问题上的准确率(或正确答案)提高了两倍,同时也减少了错误答案。

除了做出更可信的回答外,Claude 3 系列模型为来将启用引用功能,这样就可以通过指出参考资料中的精确句子来验证答案。

实时响应

Claude 3模型能够支持实时客户聊天、自动补全和数据提取任务,这些任务要求响应必须立即且实时。

Haiku是市场上同类智能模型中速度最快、性价比最高的模型。它可以在不到三秒的时间内阅读包含图表和图形的arXiv上的信息和数据密集型研究论文(约10,000个tokens)。预计在推出后将进一步改善性能。

对于绝大多数工作负载来说,Sonnet的速度是Claude 2和Claude 2.1的两倍,并且智能水平更高。它擅长需要快速响应的任务,如知识检索或销售自动化。Opus的速度与Claude 2和2.1相似,但智能水平要高得多。

200K 上下文窗口

现在,Claude 3 系列模型可提供 200K 上下文窗口。不过,所有三种型号都能接受超过 100 万个 token 的输入,未来也可能会向需要增强处理能力的特定客户提供这种服务。另外,Claude 3 Opus 实现了接近完美的召回率,准确率超过 99%。

文章参考:Claude3

  • 5
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值