Claude 3.5一夜封王,全网逆天测评

最新推荐文章于 2024-10-02 21:42:48 发布

段天狼WOLF

最新推荐文章于 2024-10-02 21:42:48 发布

阅读量500

点赞数 5

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Zc2211767/article/details/141163917

版权

据称，Claude 3.5 Sonnet不仅在评估中胜过GPT-4o，还保持了作为「中杯」的最优性价比，超过了自家的Claude 3 Opus。

如今，Claude 3.5 Sonnet已经面向全球开启免费试用了。

在费用上，Sonnet处理每百万输入token仅需3美元，每百万输出token仅为15美元。

对比之下，GPT-4o的每百万输入token收费5美元，每百万输出token为15美元，在价格上可以说是不相上下。正式对打时，各家可以说是已经都压低到了成本价。

国内直登Claude使用

功能实测

2分钟一个小游戏

一位开发者直接用了不到2分钟，做出了一个戴着太阳镜的小狗吃骨头的游戏。

神经网络可视化

有人还去做了可视化深度学习，不过因为消息限制，不得不暂停。

重建3D「模拟矩阵」

Claude 3.5 Sonnet是第一个能在首次尝试中，重现电影《黑客》中「数据流」3D场景的模型

Artifacts改变交互

从上文也可以看出，这次更新的一大亮点，就是Claude 3.5引入的超强实时交互功能Artifacts了。

这一功能，可以说是开启了交互式AI最有潜力的形式。

它标志着Claude从对话式AI向协作工作环境的转变。而在未来，Anthorpic的设想是，整个组织都能在共享空间中集中知识、文档、工作，而Claude会随时提供服务。

在沃顿商学院教授Ethan Mollick看来，Artifacts可以说是一个简化版的代码解释器。

他上手创建的，是这样一个螃蟹小游戏。

开始的版本是这样的，稍显平淡。

教授直接问，能不能让游戏恐怖一点？然后氛围感瞬间就上来了。

总的来说，Artifacts似乎是Claude长远远景的一个信号。

长期以来，Anthropic一直表示自己主要关注企业，并且计划将Claude变成一种工具，让企业「安全地」将他们的知识、文档和正在进行的工作集中在一个共享空间中。

听起来，这种概念更像是Notion或Slack，而不是ChatGPT。而在这种系统中，Anthropic的模型将处于整个系统的中心。

吊打GPT-4o，上一代2倍速

总的来说，Claude 3.5 Sonnet在生成速度方面，实现了飞升，是上一代超大杯Claude 3 Opus的2倍。

而且，在视觉方面的表现，新模型全面超越了GPT-4o。OpenAI上个月刚发布的新模型，没想到这么快被取而代之。

在视觉基准上，Claude 3.5 Sonnet在视觉问答MMMU基准上，略逊于GPT-4o。

不过，视觉数学推理、科学表格、图表问答、文件问答上，都拿下了最高分。

Claude不仅能准确识别、转录图像中的文字内容，还结合了强大的代码生成能力，将多个模态真正集成在一起。

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。