如题,2024年10月22日,Anthropic Claude 3.5 有了一次更新, 在其官网上发布了声明 Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku,有能力的可以直接访问查看。
Claude 3.5 在价格速度等不变的基础上,对编程能力等做了进一步的提升,详见下图:
本文将对官方的声明做简单总结
Claude 3.5 Sonnet:全面升级,编程能力领先
- 升级版Claude 3.5 Sonnet在各项指标上都有显著提升,尤其是在编程方面
- 在SWE-bench Verified测试中得分从33.4%提高到49.0%,超越公开可用模型
- 在TAU-bench工具使用任务中也有明显进步
- 价格和速度与前代保持一致
Claude 3.5 Haiku:高性能与高性价比的结合
- 新一代最快速模型,性能超越前代最大模型Claude 3 Opus
- 在SWE-bench Verified测试中得分40.6%,优于许多顶级模型
- 适用于面向用户的产品、专门的子代理任务和个性化体验生成
PS:将于10月晚些时候推出
突破性:计算机操控功能
- Claude 现可像人类一样使用计算机,查看屏幕、移动光标、点击按钮和输入文本
- 开发者可以利用这一功能自动化重复性流程、构建和测试软件、进行开放式研究等
- 在 OSWorld 评估中,Claude 3.5 Sonnet 得分14.9%,远超其他AI系统
PS: 目前仍处于实验阶段,有待进一步改进
唠唠嗑
作为 AI 的 轻度/表层 使用者、严重的ctrl + c 和 ctrl + v 的依赖用户,Claude 编程能力的提升,对我来说,怎么说呢,喜忧参半?一方面,我惊叹于工作效率即将再次飞跃;另一方面,我不禁担心自己是否会被这个数字世界的新秀所取代。
作为生物信息学工作者的日常,曾几何时,分析一个数据,需要我绞尽脑汁整理思路,盘点自己的技能储备,然后才能开始编写代码,解决问题。如今,这个过程被大大简化,只要我能够清晰、有逻辑地描述需求(有时甚至只需要提供数据),AI就能接手并完成所有的编程工作。这种转变让我不禁忧虑:在这个AI迅速发展的时代,个人的编程能力还有多少价值?是否正在进入一个 “想法至上” 的新纪元?
然而,最让我惊叹的,AI 实现计算机操控 来的如此之快!!意味着,未来,我可以拥有自己的 “贾维斯” ——一个全能的数字助手,可以帮我完成繁琐的计算机工作。这样一来,我将拥有更多自由思考的时间,可以更专注于创意和创新。但美好愿景的背后,隐藏着我的一丝忧虑,一直以来,我接受的教育和训练是否真的培养了我独立思考的能力,我是否具备批判性思维?还是说,我早已被填鸭式教育铸刻了“程式”,只会 “应该如此如此、这般这般” ,永远不会**“出错”。
当 AI 不在拘泥于一个行业,当出现更多的专业AI、职业AI,时代是不是将更名为:“钢铁侠时代”**?在这个时代里,每个人都可能成为托尼·斯塔克,借助AI的力量实现超乎想象的创造。但同时,也面临着一个严峻的问题:如何在这个世界中保持人类的独特性和不可替代性,如何让我是我?
无论如何,AI的飞速发展正在重塑我的工作方式和生活方式。作为这场技术革命的见证者和参与者,既要保持警惕,也要抱有希望。毕竟,正是在挑战中,人类往往能发现自己的潜力和韧性。在这个AI与人类共舞的新时代,我们每个人都有机会重新定义自己的角色。