Claude的---电脑控制---功能

开发者每周简报

已于 2024-10-24 07:11:00 修改

阅读量844

点赞数 12

文章标签：人工智能 chatgpt windows Agent Claude

于 2024-10-24 05:50:57 首次发布

本文链接：https://blog.csdn.net/Niki2020_2017/article/details/143198149

版权

2024年10月23日，AI领域再度迎来变革。Anthropic今年第二次掀起了轰动，推出了新的大型语言模型Claude，在几乎所有重要的基准测试中击败了OpenAI的GPT-4，遥遥领先于对手。这次，Claude不仅统治了软件工程领域，还解锁了一个令人不安的新功能：它可以完全控制用户的电脑。

你可以让Claude自动完成Excel表格、填写医生的病历，甚至直接登录你的股票账户进行投资交易。这个前景既让人兴奋又让人害怕。

小明深入体验了这项技术。对他来说，生活几乎完全由电脑组成。他的“AI团队”包括老牌的GPT、务实的LLaMA、努力变酷的Gemini，以及现在的“王者”Claude。通过升级到S3.5版本，Claude超越了GPT-4，在推理、编程和视觉问答方面大放异彩，虽然数学测试上略逊于Gemini，但总体表现无可匹敌。

然而，这次升级最引人注目的并非模型的性能，而是它的“电脑控制”功能。小明迫不及待地用API测试Claude的能力，虽然消耗了大量token，但结果让他目瞪口呆。Claude不仅能找到SVG代码，还能自动导航桌面、打开Firefox、输入网址、调用开发者工具，并成功复制代码。

不仅如此，Claude还在Excel中建立了净资产计算器，并用XPaint画了一匹“艺术”风格的小马。虽然画作粗糙，但想到这完全是用虚拟笔触完成的，还是让人感到惊奇。

然而，Claude的表现也不总是可靠。在一次编码任务中，它突然停下来浏览黄石公园的照片。这种随机性展示了它像人一样的“分心”能力，但也提醒我们：一旦Claude管理你的银行账户，它可能会把全部存款投进一个AI推动的虚拟货币中。

幸运的是，小明使用Docker沙盒环境确保了测试的安全。Claude尽管强大，但非常消耗资源，经常在任务中崩溃。即使如此，它仍然是当前最适合现实环境的AI工具。然而，它距离真正的“人类水平”还有很长的路要走，因为完成一些简单任务仍需要5到10分钟。

随着亚马逊、谷歌和微软等公司投资核能数据中心，未来像Claude这样的AI可能会嵌入每台电脑，甚至成为机器人和智能设备的“大脑”。这些机器人将驾驶汽车、做手术、烹饪美食，甚至制造玩具——彻底改变我们的生活方式。

但未来并非一片光明。小明引用了Claude的名字来源——数学家克劳德·香农的预言：有一天，人类将像狗依赖人类一样依赖机器人。