电商助手Agent技术探索
1.Agent简介
OpenAI 应用研究主管 Lilian Weng 在一篇长文中提出了 Agent = LLM(大型语言模型)+ 记忆 + 规划技能 + 工具使用这一概念。AI Agent 需要具备感知环境、做出决策并执行适当行动的能力。在这些关键步骤中,最重要的是理解输入给 Agent 的内容、进行推理、规划、做出准确决策,并将其转化为可执行的原子动作序列,以实现最终目标。
一个精简的 Agent 决策流程:感知(Perception)→ 规划(Planning)→ 行动(Action)
-
感知(Perception)是指 Agent 从环境中收集信息并从中提取相关知识的能力。
-
规划(Planning)是指 Agent 为了某一目标而作出的决策过程。
-
行动(Action)是指基于环境和规划做出的动作。
Agent 通过感知从环境中收集信息并提取相关知识。然后通过规划为了达到某个目标做出决策。最后,通过行动基于环境和规划做出具体的动作。Planning 是 Agent 做出行动的核心决策,而行动又为进一步感知提供了观察的前提和基础,形成了一个自主的闭环学习过程。
借用网上的一个案例来解释 agent 的执行:
-
当一个人问 Agent 是否会下雨时,感知模块将指令转换为 LLM 可以理解的表示。
-
然后,大脑模块开始根据当前天气和互联网上的天气预报进行推理。
-
最后,动作模