Claude 3.5全面升级，AI 时代？我将何去何从

万木春❀

已于 2024-10-24 14:34:06 修改

阅读量1.9k

点赞数 6

文章标签： 1024程序员节

于 2024-10-24 14:17:27 首次发布

本文链接：https://blog.csdn.net/weixin_46128755/article/details/143206496

版权

如题，2024年10月22日，Anthropic Claude 3.5 有了一次更新，在其官网上发布了声明 Introducing computer use, a new Claude 3.5 Sonnet, and Claude 3.5 Haiku，有能力的可以直接访问查看。
Claude 3.5 在价格速度等不变的基础上，对编程能力等做了进一步的提升，详见下图：
在这里插入图片描述
本文将对官方的声明做简单总结

Claude 3.5 Sonnet：全面升级，编程能力领先

升级版Claude 3.5 Sonnet在各项指标上都有显著提升，尤其是在编程方面
在SWE-bench Verified测试中得分从33.4%提高到49.0%，超越公开可用模型
在TAU-bench工具使用任务中也有明显进步
价格和速度与前代保持一致

Claude 3.5 Haiku：高性能与高性价比的结合

新一代最快速模型，性能超越前代最大模型Claude 3 Opus
在SWE-bench Verified测试中得分40.6%，优于许多顶级模型
适用于面向用户的产品、专门的子代理任务和个性化体验生成

PS：将于10月晚些时候推出

突破性：计算机操控功能

Claude 现可像人类一样使用计算机，查看屏幕、移动光标、点击按钮和输入文本
开发者可以利用这一功能自动化重复性流程、构建和测试软件、进行开放式研究等
在 OSWorld 评估中，Claude 3.5 Sonnet 得分14.9%,远超其他AI系统

PS: 目前仍处于实验阶段,有待进一步改进

唠唠嗑

作为 AI 的轻度/表层使用者、严重的ctrl + c 和 ctrl + v 的依赖用户，Claude 编程能力的提升，对我来说，怎么说呢，喜忧参半？一方面，我惊叹于工作效率即将再次飞跃；另一方面，我不禁担心自己是否会被这个数字世界的新秀所取代。
作为生物信息学工作者的日常，曾几何时，分析一个数据，需要我绞尽脑汁整理思路，盘点自己的技能储备，然后才能开始编写代码，解决问题。如今，这个过程被大大简化，只要我能够清晰、有逻辑地描述需求（有时甚至只需要提供数据），AI就能接手并完成所有的编程工作。这种转变让我不禁忧虑：在这个AI迅速发展的时代，个人的编程能力还有多少价值？是否正在进入一个 “想法至上” 的新纪元？
然而，最让我惊叹的，AI 实现计算机操控 来的如此之快！！意味着，未来，我可以拥有自己的 “贾维斯” ——一个全能的数字助手，可以帮我完成繁琐的计算机工作。这样一来，我将拥有更多自由思考的时间，可以更专注于创意和创新。但美好愿景的背后，隐藏着我的一丝忧虑，一直以来，我接受的教育和训练是否真的培养了我独立思考的能力，我是否具备批判性思维？还是说，我早已被填鸭式教育铸刻了“程式”，只会 “应该如此如此、这般这般” ，永远不会**“出错”。
当 AI 不在拘泥于一个行业，当出现更多的专业AI、职业AI，时代是不是将更名为：“钢铁侠时代”**？在这个时代里，每个人都可能成为托尼·斯塔克，借助AI的力量实现超乎想象的创造。但同时，也面临着一个严峻的问题：如何在这个世界中保持人类的独特性和不可替代性，如何让我是我？
无论如何，AI的飞速发展正在重塑我的工作方式和生活方式。作为这场技术革命的见证者和参与者，既要保持警惕，也要抱有希望。毕竟，正是在挑战中，人类往往能发现自己的潜力和韧性。在这个AI与人类共舞的新时代，我们每个人都有机会重新定义自己的角色。