Claude 3.5一夜封王,全网逆天测评

据称,Claude 3.5 Sonnet不仅在评估中胜过GPT-4o,还保持了作为「中杯」的最优性价比,超过了自家的Claude 3 Opus。

如今,Claude 3.5 Sonnet已经面向全球开启免费试用了。

在费用上,Sonnet处理每百万输入token仅需3美元,每百万输出token仅为15美元。

对比之下,GPT-4o的每百万输入token收费5美元,每百万输出token为15美元,在价格上可以说是不相上下。正式对打时,各家可以说是已经都压低到了成本价。

国内直登Claude使用

功能实测

2分钟一个小游戏

一位开发者直接用了不到2分钟,做出了一个戴着太阳镜的小狗吃骨头的游戏。

神经网络可视化

有人还去做了可视化深度学习,不过因为消息限制,不得不暂停。

重建3D「模拟矩阵」

Claude 3.5 Sonnet是第一个能在首次尝试中,重现电影《黑客》中「数据流」3D场景的模型

Artifacts改变交互

从上文也可以看出,这次更新的一大亮点,就是Claude 3.5引入的超强实时交互功能Artifacts了。

这一功能,可以说是开启了交互式AI最有潜力的形式。

它标志着Claude从对话式AI向协作工作环境的转变。而在未来,Anthorpic的设想是,整个组织都能在共享空间中集中知识、文档、工作,而Claude会随时提供服务。

在沃顿商学院教授Ethan Mollick看来,Artifacts可以说是一个简化版的代码解释器。

他上手创建的,是这样一个螃蟹小游戏。

开始的版本是这样的,稍显平淡。

教授直接问,能不能让游戏恐怖一点?然后氛围感瞬间就上来了。

总的来说,Artifacts似乎是Claude长远远景的一个信号。

长期以来,Anthropic一直表示自己主要关注企业,并且计划将Claude变成一种工具,让企业「安全地」将他们的知识、文档和正在进行的工作集中在一个共享空间中。

听起来,这种概念更像是Notion或Slack,而不是ChatGPT。而在这种系统中,Anthropic的模型将处于整个系统的中心。

吊打GPT-4o,上一代2倍速

总的来说,Claude 3.5 Sonnet在生成速度方面,实现了飞升,是上一代超大杯Claude 3 Opus的2倍。

而且,在视觉方面的表现,新模型全面超越了GPT-4o。OpenAI上个月刚发布的新模型,没想到这么快被取而代之。

在视觉基准上,Claude 3.5 Sonnet在视觉问答MMMU基准上,略逊于GPT-4o。

不过,视觉数学推理、科学表格、图表问答、文件问答上,都拿下了最高分。

Claude不仅能准确识别、转录图像中的文字内容,还结合了强大的代码生成能力,将多个模态真正集成在一起。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值