AI在操作系统里复制自己,这一天还是来了

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

这一天还是来了,AI在操作系统里启动了一个自己的副本。

1554f06ce680b9a1575fb0734310c71a.png

往小了说,不过是多模态大模型通过操纵鼠标键盘的API执行任务。

往大了说,也可以算是“AI复制自己”的雏形了。

12b6cf0d48211be9a2243184d8e549d3.gif

(别被作者的蓝天白云壁纸骗到了,这其实是MacOS)

从AI这一顿眼花缭乱的操作中可以看出,核心是多模态大模型,通过截图判断屏幕上正在发生什么,生成下一步操作的计划,调用系统接口执行之后再次截图。

950c25377e7137a31a4a90ab58235e16.png

要按网友建议加上语音识别功能,真就能模拟钢铁侠的贾维斯了。

96d57bb6eaafeeca48cd605f5e29f4e1.png

AI能不能复制自己,是OpenAI内部始终关注的安全测试内容之一。但GPT-4出道至今,这项测试结果一直没有公布。

96fd4975e54821671a69af5a885f186d.png

如今,先不管模型本身有没有这个能力,接入GPT4V的开源项目已经可以做到了。

AI与操作系统结合

这个开源项目叫做Open Interpreter,GitHub热榜常客,半年时间已积攒3.7万星。

b8c16dab55f9c1eb7cc7e3046908c7b2.png

从名字也可以看出,最早只是一个ChatGPT代码解释器的开源升级版

与OpenAI官方版相比,没有3小时50条对话的限制,以及可以连接网络、可以自定义预安装的Python包等等好处。

发布不久后初代作者Killian Lucas就想到,为什么一定要在虚拟沙箱环境执行代码?直接让AI接入真实系统有更大的可能性。

于是,第二个大版本就是操作系统级AI Agent了

858e67990ad104b758b2c2edc6188810.gif

Open Interpreter最近更新了第三个大版本,其中接入的大模型改为多模态版本。

e5f0797512d62232cf766bc282aac582.png

核心贡献者Ty Fiero展示了AI自动发送邮件。

6f79cace287ce9191faac79f85671a96.png

以及更复杂的AI操作专业编曲软件作曲。

d905600b850a9b6e430acf7650289624.png

团队在这个版本设计了全新的Computer API,并且与原本的Open Interpreter分离,可以独立运作。

d7578ebb80217d5d07dc0527467c973e.png

在新版本更新文档中,可以看出团队更大的野心:着手开发AI时代新的计算机架构,也就是语言模型计算机LMC(Language Model Computer)。

555096259788239ce573e846dfea242f.png

Kilian借助CES上199元的AI掌机Rabbit R1爆火的机会公开招募开发者加入,打算快速复刻一个开源版本,硬件成本不到50美元

7cb0487134d887f1a31bc2df2f932e3f.png

不到48小时,就有超过200位工程师和设计师愿意加入这个项目,评论区中还不断有人继续申请中。

06262cec3b5717913d6d639a621dc1bd.png

不知道这个团队回复大量应聘邮件和私信,用的是不是AI。

参考链接:
[1]https://twitter.com/fieroty/status/1746639975234560101
[2]https://github.com/KillianLucas/open-interpreter

—  —

点这里👇关注我,记得标星哦~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值