OpenAI最强竞对发布Claude 3，超过GPT-4-CSDN博客

本文链接：https://blog.csdn.net/weixin_44053915/article/details/136477271

Anthropic 大模型公司今日重磅发布了其第三代人工智能（AI）模型 ——Claude 3 系列模型，包括 Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku 。每个模型都提供了不同程度的智能、速度和成本选择，旨在满足广泛的人工智能应用需求。

这三款模型在推理、数学、编码、多语言理解和视觉处理等方面相当扎眼。其中，Claude 3 Opus 为 Claude 3 系列模型的最强版本，具有接近人类的理解能力，可以灵巧地处理开放式提示和复杂的任务。

在 claude.ai 体验网址上，Claude 3 免费版用户使用 Sonnet 模型。而订阅用户将能够体验到更高级的 Opus 模型。

此外，Anthropic 团队还表示，Claude 3 系列模型解决了之前模型经常出现“不必要的拒绝”的问题。

Anthropic 官方宣称， Opus 模型智能程度堪比人类，能够游刃有余地应对开放式问题，并巧妙解决各种复杂挑战。

从官方发布的成绩单来看，在知识测试 MMLU、推理测试 GPQA、基础数学测试 GSM8K 等一系列基准测试中，超大杯 Claude 3 Opus 模型展现了卓越的性能，其每一项得分都全面超越了 GPT-4 以及 Gemini 1.0 Ultra。

与 Claude 2.1 相比，Claude 3 Opus 在具有挑战性的开放式问题上的准确率（或正确答案）提高了两倍，同时也减少了错误答案。

除了做出更可信的回答外，Claude 3 系列模型为来将启用引用功能，这样就可以通过指出参考资料中的精确句子来验证答案。

Claude 3模型能够支持实时客户聊天、自动补全和数据提取任务，这些任务要求响应必须立即且实时。

Haiku是市场上同类智能模型中速度最快、性价比最高的模型。它可以在不到三秒的时间内阅读包含图表和图形的arXiv上的信息和数据密集型研究论文（约10,000个tokens）。预计在推出后将进一步改善性能。

对于绝大多数工作负载来说，Sonnet的速度是Claude 2和Claude 2.1的两倍，并且智能水平更高。它擅长需要快速响应的任务，如知识检索或销售自动化。Opus的速度与Claude 2和2.1相似，但智能水平要高得多。

现在，Claude 3 系列模型可提供 200K 上下文窗口。不过，所有三种型号都能接受超过 100 万个 token 的输入，未来也可能会向需要增强处理能力的特定客户提供这种服务。另外，Claude 3 Opus 实现了接近完美的召回率，准确率超过 99%。

文章参考：Claude3