任务执行模型ACT-1,你的贴心小管家

5 篇文章 1 订阅

在这里插入图片描述

AI模型最近几年在不同领域大放异彩。其中不同类型的Transformer模型,在不同领域都有及其重要的贡献。

  • 语言模型:GPT,PaLM,Chinchila
  • 编码:Codex,AlphaCode
  • 图像生成:DALL-E,Imagen

除了上述领域外,这篇文章开发了新的一个领域:在数据场景下执行任务,并发布了新模型称为Action Transformer(ACT-1)。

这个模型令人感兴趣的点在于:

  • 它能够在电脑面前使用任意一个软件,API工具等,用来辅助需要在电脑前完成的工作
  • 需要利用到自然语言推断,用来告诉模型我们到底需要做什么

**ACT-1是一个大型的Transfromer模型,它能够在浏览器上执行相应的动作。**比如在Chrome浏览器上,类似于插件的形式,观察网页内容同时执行正确的动作:像点击,输入,滑动等。同时它也能够完成较为复杂的任务。

比如:在网页上输入需要订的酒店类型和预算,它能够帮你在网页上进行操作:
在这里插入图片描述

它也能够执行更加复杂的任务和操作:例如可以完成在Salesforce上需要10+的点击动作的任务
在这里插入图片描述

同时它也能够在excel中,根据输入的命令,来给出计算公式:
在这里插入图片描述

不仅仅在单独软件上进行操作,ACT-1也能够协作多个不同的软件,执行给定的任务指令。
在这里插入图片描述

该作者任务,自然语言接口将会极大的改变人们在电脑前的工作,他们给出了未来的畅想:

  • **未来与电脑的互动将会更多的使用自然语言,而不是使用软件GUI进行操作。**相当于我们只要输入命令给它,它会自己自动执行任务
  • **初学者不需要培训,也会是一个熟练的使用者。**任何人只要使用自然语言,都能够表达自己的想法,而不需要特定的专业知识。软件会变得更加强大,而不会仅仅局限于一个下拉菜单的长度。
  • 以后软件的文档和手册,不是给用户看的,而是直接让模型进行学习。
  • **让AI突破更多的领域,会使得AI在未来更像是我们的工作伙伴。**在可以遇见的未来,AI会在设计,工程等领域辅助人们实现更加复杂的功能。

目前这个软件正在测试中,有兴趣的可以去官网进行申请,加入waitlist等待测试哦~

目前ACT-1模型还有很多不足的地方,因此创作团队还是希望它能够不断学习,争取做更多复杂的任务。同时论文细节还没有放出来,等放出来之后可以具体看看。

值得一提的是,该团队的负责人,就是Transformer的作者Vaswani,果然大佬都是非同寻常的。
在这里插入图片描述

本期就到这里,我是leo~,欢迎关注我的知乎/公众号“算法一只狗”,我们下期再见。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

洛克-李

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值