2024年10月23日,AI领域再度迎来变革。Anthropic今年第二次掀起了轰动,推出了新的大型语言模型Claude,在几乎所有重要的基准测试中击败了OpenAI的GPT-4,遥遥领先于对手。这次,Claude不仅统治了软件工程领域,还解锁了一个令人不安的新功能:它可以完全控制用户的电脑。
你可以让Claude自动完成Excel表格、填写医生的病历,甚至直接登录你的股票账户进行投资交易。这个前景既让人兴奋又让人害怕。
小明深入体验了这项技术。对他来说,生活几乎完全由电脑组成。他的“AI团队”包括老牌的GPT、务实的LLaMA、努力变酷的Gemini,以及现在的“王者”Claude。通过升级到S3.5版本,Claude超越了GPT-4,在推理、编程和视觉问答方面大放异彩,虽然数学测试上略逊于Gemini,但总体表现无可匹敌。
然而,这次升级最引人注目的并非模型的性能,而是它的“电脑控制”功能。小明迫不及待地用API测试Claude的能力,虽然消耗了大量token,但结果让他目瞪口呆。Claude不仅能找到SVG代码,还能自动导航桌面、打开Firefox、输入网址、调用开发者工具,并成功复制代码。
不仅如此,Claude还在Excel中建立了净资产计算器,并用XPaint画了一匹“艺术”风格的小马。虽然画作粗糙,但想到这完全是用虚拟笔触完成的,还是让人感到惊奇。
然而,Claude的表现也不总是可靠。在一次编码任务中,它突然停下来浏览黄石公园的照片。这种随机性展示了它像人一样的“分心”能力,但也提醒我们:一旦Claude管理你的银行账户,它可能会把全部存款投进一个AI推动的虚拟货币中。
幸运的是,小明使用Docker沙盒环境确保了测试的安全。Claude尽管强大,但非常消耗资源,经常在任务中崩溃。即使如此,它仍然是当前最适合现实环境的AI工具。然而,它距离真正的“人类水平”还有很长的路要走,因为完成一些简单任务仍需要5到10分钟。
随着亚马逊、谷歌和微软等公司投资核能数据中心,未来像Claude这样的AI可能会嵌入每台电脑,甚至成为机器人和智能设备的“大脑”。这些机器人将驾驶汽车、做手术、烹饪美食,甚至制造玩具——彻底改变我们的生活方式。
但未来并非一片光明。小明引用了Claude的名字来源——数学家克劳德·香农的预言:有一天,人类将像狗依赖人类一样依赖机器人。