如何评价新版的Claude-3.5 sonnet?一篇文章告诉你

如果单从能力上来看,很厉害,有专门的数据显示:Claude仅次于o1.


如果把Claude新推出的Computer Use单拎出来的话,大拇哥。 


不同于国内模型玩文字游戏,新版的Claude-3.5 sonnet自推出以来,被众多网友以及机构进行实测。


得出的结论:比o1-preview模型稍逊。


1.Claude到底怎么样


针对在中文场景下的推理和代码的性能问题,专业第三方测评机构SuperCLUE对Claude 3.5 Sonnet升级版进行了深入评估。

分数仅次于o1-preview。 

782077bdd4fa4f2c8306ec20bf68f307.png


数学大神陶哲轩和Karpathy的数学测试,Claude-3.5-sonnet也是表现较好的那一个,力压o1-preview,仅次于gemini 1.5 pro。

0d577edcc0f34cbba652c5ac5914863a.png


基于以上第三方的测评,可以得到一个清晰的结论:Claude-3.5 sonnet的是真的强。 


Claude除了在测评中表现优异外,它新推出的Computer use更是被称为划时代的功能。


Computer use:可以让Claude像人一样使用计算机!


比如,跟Claude说一声想看金门大桥的日出,它就会在网页搜索信息、地图中找位置、规划出行路线,最后把出行的方案塞进你的日历里:

17c46a0d9dfa41b99040cea3b003e44f.png


这种能力真正的打破AI模型和用户的交互方式,从而让Claude像一个机器人一样,只需输入命令,它就能操作电脑完成所有事情,这是以往任何一个模型都所不具备的功能。 


除了Computer use以外,Claude最近还推出MCP,这是一个协议,用于连接AI助手和数据存储系统。 


简单来说,它可以让AI助手直接访问你电脑上的数据。 


以前,使用AI处理数据特别麻烦。你需要费力地复制粘贴文件,或者手动下载上传。现在不同了!MCP可以让AI直接读取你电脑上的文件、网盘文档、聊天记录等,而且还能像人一样自动操作浏览器,变得特别方便。


2.Claude这么强,我们要如何使用


下面我将从其他三个维度来讲述为什么Claude这么好用,以及这么多人使用。

Claude的用户主要可以是分为三波人:程序员、从事文字写作、数据分析。当然还有其他行业的人。
 程序员: 如果你是一位程序员,大概已经用过或用上Claude或Cursor了吧。有一位大厂朋友跟我说:之前在大厂三五天写的几个函数,现在用Claude可能十几分钟就写完了,质量还更好。

c01398348e7246f9b8cafe51e5d2f795.png

还有UI设计,可以先让Claude生成出几版设计出来,作为灵感,如果觉得生成的不错,还可以直接使用里面的代码。不过连调这块,还是需要后端的配合。

4b66fb6161454b95bb6d0a8e677f9fc8.png


从事文字写作:从事文字写作的朋友如果用过Claude,会发现一个很棒的点,Claude的文字输出更像人,而且输出的质量更好,最近AI博主数字人卡兹克在文章上也指出,身边的内容创作者清一色的喜欢使用Claude而不是ChatGPT。

9e257a5b4bc44216bc79796097470d30.png

所以,如果你是做内容创作或从事文字相关的工作,Claude可以去尝试一下。 


数据分析:为什么会把数据分析单独拎出来,因为最近用Claude做数据分析真的太爽了,以往可能就是让它帮我输出有一些Excel的公式,或者更加复杂点的话会用来帮我写一些SQL语言。  现在我可以直接使用它来做数据可视化。

9cc678ea18ee40f6812efb227cf0195b.png


就如上面的数据可视化图片,你之前让我做一个类似的,没有三天大概率是做不出了,现在,把数据扔给它,不出30秒,就生成好了,效果就不用我多说了吧。 


 如果Claude很好用,但它的使用难度可不低,国内的用户的Claude账号还经常被封,下面是我整理国内使用Claude的方法,大家可以按需选择。

3.Claude的4种使用的方法

通常的方法

用Claude需要搞定三个问题:网络限制、号码验证以及订阅难题,三者缺不可,值得注意的是,网络好一点,要不然你注册账号的速度还抵不上封号的速度。

网络限制这块大家自行去想办法,这里不好说。  支付难题,可以去wildcard平台申请一张卡片,用那里面的卡去订阅Claude。

使用方法:

因为Claude封号太过于厉害,就能完美的避免这种情况,再加上这类网站不需要特殊网络。所有很多人会在选择在这里面使用Claude。

这块我没有太多的研究,不过可以给大家推荐自己现在使用的——2233.ai

 中转站——Poe


Poe相信大家并不陌生,全球较大的AI聚合站,里面不仅有Claude、ChatGPT等语言模型,还有Flux、Runway、Pika等。而且Poe是采用积分模式的,所有你只要订阅了Poe,相当于你可以使用Poe里面所有的模型。


Poe的价格是和Claude的一样,20美刀,Poe的订阅同样是不支持国内的卡,如果没有海外的,大家可以按照刚刚提的方法,在wildcard申请一张海外支付卡。  


调用API使用Claude


这个方法是四种方法里面较难的,主要是面向开发人员。需要在Claude的控制台申请API,然后再将申请的API Keys输入到第三方网站,才能使用。

 这种方法下,Claude原有的很多功能都是用不了的,好处就是你用多少,就扣你多少。


 

关于"Claude 3.5 Sonnet"的具体信息在网络上的直接提及较少,这可能是因为Claude作为一个特定的人工智能产品系列,通常不会与Sonnet(十四行诗)这一诗歌形式关联起来。然而,在信息技术领域,“sonnet”也可能指的是某些硬件组件或者技术名词,但结合Claude来看,这样的组合并不常见。 考虑到用户可能是想询问有关Claude 3.5版本的信息以及它如何应用于文学创作或是其他创意写作方面的能力,以下是根据这个假设整理的相关信息: Claude 3.5是一个迭代更新后的大型语言模型,相较于之前的版本,该版本在处理文本生成任务上有了显著改进,包括但不限于提高对于复杂对话的理解能力、增强数值推理性能等特性。这意味着当涉及到文学作品创作时——例如撰写十四行诗(Sonnet),Claude 3.5可以更加精准地捕捉到这种经典诗歌体裁的特点,并尝试模仿莎士比亚或其他著名诗人风格来进行创作。 为了利用Claude 3.5进行十四行诗的创作或者其他类型的文学探索,建议访问官方提供的API文档或教程页面获取具体指导说明;同时也可以参考社区论坛里分享的经验贴子以获得更多灵感和支持。 此外,值得注意的是,虽然Claude具备一定的创造力,但在实际应用过程中仍需人类创作者参与其中给予方向性的指引确保最终产出既符合预期又不失艺术价值。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值