魔搭开源移动端框架Mobile-Agent-v2抢先体验

IT大头

已于 2024-06-12 10:53:52 修改

阅读量1.3k

点赞数 5

文章标签： DashInfer 人工智能

于 2024-06-12 10:48:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45156060/article/details/139620469

版权

在刚结束的苹果全球开发者大会WWAC上，Apple家族AI全家桶「Apple Intelligence」亮相，库克宣布个人智能系统将应用于新版本的 iPhone、iPad 和 Mac 操作系统。未来，新Siri将脱胎换骨，在Apple Intelligence的系统支撑下，拥有更丰富的语言理解能力、更灵活地日常任务处理能力。结合屏幕感知功能，新Siri可以让用户轻松执行与屏幕上的信息相关操作，比如把聊天信息中收到的地址自动添加到朋友的通讯录里。由此，Siri 可以在应用程序中或跨应用程序执行数百项新操作，此次更新依赖于苹果今年四月份低调发布的一项工作——多模态大语言模型（MLLM） Ferret-UI，针对移动用户界面（UI）屏幕的理解进行优化，其具备引用、定位和推理能力。

类似的工作，在今年二月份，由阿里通义实验室提出的手机端智能体开源框架Mobile-Agent，即可实现一句指令输入，AI可以作为智能中枢，根据指令在手机上自动规划和操作各种APP。

Mobile-Agent凭借强劲的自动化手机操作能力迅速在AI领域和手机制造商中引起广泛关注。短短五个月内，已在Github获得了2,000个Star。该系统采用纯视觉方案，通过视觉感知工具和操作工具完成智能体在手机上的操作，无需依赖任何系统级别的UI文件。得益于这种智能体中枢模型的强大，Mobile-Agent实现了即插即用，无需进行额外的训练和探

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

IT大头 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。