现在语言模型已经做到,你告诉做什么,它就去做什么了,比如你告诉他翻译,他就会翻译,告诉它摘要,他就会摘要,但是它还能更进一步么? 能不能做一个大型综合性的任务呢?这就是AI Agent
AI Agent 能做什么
今天人类做的许多事情,都是一个需要多步骤的复杂任务,比如你要和 朋友去展览,你要先确认朋友的时间,然后预定票,如果没有票,你还可以换一天…总之这是一系列的事清,且是有先后顺序的,不能颠倒,单纯的一个AI是做不了的,还需要与外界的各种交互才能完成,这就需要AI Agent
现在的AI Agent 模型
目前有一些AI Agent模型可以体验,如下:
AI Agent都能做些什么呢
目前有些出名的应用是,用语言模型操纵机器人取东西,比如特别出名的Figure,还有让语言模型生成代码,操控汽车的有运行等等。
AI Agent可能的运作原理
AI Agent可以从外界获取记忆以及经验,再根据当下从外界获取的状态,和终极目标,把目标拆解成短期的小目标,然后再转化为可执行的操作,这些操作 又会反过来影响外界,从而进一步更新记忆或者经验,然后修改下一步的计划,继续执行。
要想实现上面这些功能,GPT是需要有些记忆的,现在也有人专门先把之前的内容摘要,然后加上RAG,打造一个有记忆力的没模型。有篇篇论文https://arxiv.org/abs/2310.08560 ,就是来介绍怎么打造有记忆力的GPT。计划的修改,可以看看 https://arxiv.org/abs/2302.01560
还有对于计划的反思,也有论文 https://arxiv.org/abs/2210.03629
未来是AI Agent的天下~