经过半年多的酝酿,就在今天,Anthropic终于推出了全球首个混合推理模型——Claude 3.7 Sonnet,这被称为扩展思考模式的最强大代表。在最新的测试中,该模型展现出超强的性能,力压ChatGPT o3-mini和DeepSeek R1等模型。
啥叫混合推理模型?
简单来说,ChatGPT o3-mini、DeepSeek R1、Gemini 2.0 和 Grok 3 等等模型都是单独推理模型。
而 Claude 3.7 Sonnet 用一种混合推理架构,将逻辑推理与生成能力进行了深度融合,能够进行可扩展且逐步深入的思考。
在设计学术和科研方面的内容生成和回答方面,Claude-3.7-Sonnet表现如何?
我测试了一下,和GPT o1的准确度相当