据称,Claude 3.5 Sonnet不仅在评估中胜过GPT-4o,还保持了作为「中杯」的最优性价比,超过了自家的Claude 3 Opus。
如今,Claude 3.5 Sonnet已经面向全球开启免费试用了。
在费用上,Sonnet处理每百万输入token仅需3美元,每百万输出token仅为15美元。
对比之下,GPT-4o的每百万输入token收费5美元,每百万输出token为15美元,在价格上可以说是不相上下。正式对打时,各家可以说是已经都压低到了成本价。
国内直登Claude使用
功能实测
2分钟一个小游戏
一位开发者直接用了不到2分钟,做出了一个戴着太阳镜的小狗吃骨头的游戏。
神经网络可视化
有人还去做了可视化深度学习,不过因为消息限制,不得不暂停。
重建3D「模拟矩阵」
Claude 3.5 Sonnet是第一个能在首次尝试中,重现电影《黑客》中「数据流」3D场景的模型
Artifacts改变交互
从上文也可以看出,这次更新的一大亮点,就是Claude 3.5引入的超强实时交互功能Artifacts了。
这一功能,可以说是开启了交互式AI最有潜力的形式。
它标志着Claude从对话式AI向协作工作环境的转变。而在未来,Anthorpic的设想是,整个组织都能在共享空间中集中知识、文档、工作,而Claude会随时提供服务。
在沃顿商学院教授Ethan Mollick看来,Artifacts可以说是一个简化版的代码解释器。
他上手创建的,是这样一个螃蟹小游戏。
开始的版本是这样的,稍显平淡。
教授直接问,能不能让游戏恐怖一点?然后氛围感瞬间就上来了。
总的来说,Artifacts似乎是Claude长远远景的一个信号。
长期以来,Anthropic一直表示自己主要关注企业,并且计划将Claude变成一种工具,让企业「安全地」将他们的知识、文档和正在进行的工作集中在一个共享空间中。
听起来,这种概念更像是Notion或Slack,而不是ChatGPT。而在这种系统中,Anthropic的模型将处于整个系统的中心。
吊打GPT-4o,上一代2倍速
总的来说,Claude 3.5 Sonnet在生成速度方面,实现了飞升,是上一代超大杯Claude 3 Opus的2倍。
而且,在视觉方面的表现,新模型全面超越了GPT-4o。OpenAI上个月刚发布的新模型,没想到这么快被取而代之。
在视觉基准上,Claude 3.5 Sonnet在视觉问答MMMU基准上,略逊于GPT-4o。
不过,视觉数学推理、科学表格、图表问答、文件问答上,都拿下了最高分。
Claude不仅能准确识别、转录图像中的文字内容,还结合了强大的代码生成能力,将多个模态真正集成在一起。