一句话手机自己打车,开源多智能体AI助手,非苹果手机也能玩

这项成果来自阿里通义实验室Mobile-Agent的v2版本更新,具体来说,本次升级有三大亮点。

一句话让AI自动化操作手机,打个车已经不是难事了。

从官方公布的演示视频来看,用户只需要说出目的地,Agent就能够通过规划、决策和反思的流程自动化帮用户完成目的地输入,呼叫车辆等操作,适用于老人及视障人群,解决他们不会使用或者无法使用手机APP的问题。

这项成果来自阿里通义实验室Mobile-Agent的v2版本更新,具体来说,本次升级有三大亮点:

  • 首次在手机操作任务上采用多智能体架构,并延续了一代的纯视觉方案
  • 多智能体各司其职,实现了更有效的任务进度追踪、任务相关信息记忆和操作反思
  • 更强大的复杂指令拆解能力、跨应用操作能力和多语言场景操作能力

任务难度提升,v2也能搞定

首先我们关注一下Mobile-Agent-v2的演示效果。从作者团队发布的演示视频来看,Mobile-Agent-v2能够完成的任务难度相比于Mobile-Agent有明显的提升。下面将展示部分演示

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

诗者才子酒中仙

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值