写在前面
当 AI 能力达到的时候,不用强行推广,自然而然就契合市场了,就像 ChatGPT,从来没打广告,却让全世界的人口口相传。当 AI 能力达不到的时候,老板、产品、销售就算把 AI 工程师逼死,也搞不出成果来。(忘了在哪里看到的了)
OpenAI头号竞争对手
想知道Claude是何方圣神,需要从OpenAI的头号竞争对手说起——Anthropic,Anthropic是一家位于美国加州旧金山的人工智能初创公司,成立于2021年。该公司由OpenAI(ChatGPT的开发机构)前研究副总裁达里奥·阿莫迪(Dario Amodei)、大语言模型GPT-3论文的第一作者汤姆·布朗(Tom Brown)等人共同创立。
Claude
当地时间2024年3月4日,没有任何征兆,Anthropic发布Claude 3,官方宣称全方位超越GPT-4,发布没多久,再次掀起千层浪,就连特斯拉的CEO埃隆·马斯克(Elon Musk)都在Anthropic发布Claude 3的 X(原推特)平台评论区中留言“Impressive”。
Claude 3系列包括Haiku(Haiku意指俳句)、Sonnet(Sonnet意指十四行诗)和 Opus(Opus意指艺术作品),三个版本的功能依次增强,价格成本也依次上升。其中,增强版的Sonnet和最强版的Opus已经在claude.ai和Claude API中开放。亚马逊云和谷歌云的用户已经通过Amazon Bedrock和Vertex AI Model Garden来使用Sonnet。
随着Claude 3 的横空出世,网友们纷纷调侃OpenAI要“坐不住了”,催促OpenAI尽快放出酝酿已久的GPT-5,甚至是传说中的Q*项目。
Claude 3 可以预测美国经济,预测的GDP走向准确度在5%以内。Claude 3 Opus的各项能力指标均超过了GPT-4和Gemini 1.0 Ultra。
来源于官网
据科技自媒体“平凡的平凡”测评,将刘慈欣2万字的小说《乡村医生》分别给到Claude 3和GPT-4后,提问历史学家的名字,Claude 3找出了历史学家名字所在段落,而GPT-4没找到。
在困扰大模型的“幻觉”问题上,Claude 3也取得了显著进步。将模型的回复分类为正确答案、错误答案(或幻觉)以及不确定的回答,Claude 3 Opus提供正确答案的频率已经升到了前一代模型Claude 2.1的两倍,并且更少出现对事实的编造。
一句话总结
Claude 3 系列模型在推理、数学、编码、多语言理解和视觉方面,都树立了新的行业基准。
更多评估内容
关于更多的模型评测,建议阅读报告原文,报告总共42页,包含了73篇参考文献,内容如下:
https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf