Modelscope Agent初体验与思考

文章探讨了大语言模型如ChatGPT的局限,如无法实时查询、缺乏推理能力和微调问题。Agent作为解决方案,利用外部API获取补充信息,结合记忆、规划和工具使用,如斯坦福小镇项目的生成式Agent设计。文中提到如何识别用户意图、调用API及在实际应用中的挑战,如天气查询和图像生成API的表现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景:LLM → \to Agent

ChatGPT为代表的大语言模型就不用过多的介绍了,ChatGPT很强大,但是也有做不到的东西。

例如:

  1. 实时查询问题:实时的天气,地理位置,最新新闻报道,现实世界正在发生和刚结束的信息等
  2. 不能产生动作:你只能获得语言的回复,而不能让它执行动作。当然也有类似的工作(Reac、AutoGPT)
  3. 无法访问专有信息源。模型无法访问专有信息,例如公司数据库中的客户名册或在线游戏的状态。
  4. 缺乏推理能力。某些推理超出了神经方法的能力范围,需要专门的推理过程。我们在上面看到了算术推理的经典例子。 GPT-3 和 Jurassic-1 在 2 位加法上表现良好,令人印象深刻,但在 4 位加法上自信地给出了无意义的答案。随着训练时间的增加、更好的数据和更大的模型,LLM 的性能将会提高,但不会达到 20 世纪 70 年代 HP 计算器的鲁棒性。而数学推理只是冰山一角。
  5. 微调成本问题。微调和服务多个大型模型是不切实际的。我们也无法针对训练中未涵盖的新任务进一步调整经过多任务训练的 LLM ;由于灾难性遗忘,添加新任务需要对整个任务集进行重新训练。考虑到训练此类模型的成本,这显然是不可行的。

那么Agent又是什么?

agent用来调用外部 API 来获取模型权重中缺失的额外信息(通常在预训练后很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。

对于agent的定义

将 Agents 定义为LLM + memory + planning skills + tool use,即大语言模型、记忆、任务规划、工具使用的集合。

在这里插入图片描述


生成式Agent

这个方向非常的火,效果也非常的惊人。例如大名鼎鼎的斯坦福小镇项目:

在这里插入图片描述
在这里插入图片描述

  • 核心构建原理如下图:
    在这里插入图片描述
  • 生成Agent的设计将 LLM 与记忆、规划和反射机制相结合,使代理能够根据过去的经验进行行为,并与其他代理进行交互。

更多关于LLM-Agent可以阅读一下这篇blog:LLM-Based Agent


Agent调用流程

结合背景调研,我简单的猜想一下魔塔Agent构建的实际流程:

  1. 用户意图识别:在每个用户语句之后,模型需要确定是否需要 API 调用来访问外部服务,这需要能够了解其知识的边界或是否需要外部操作。
  2. 找到合适的API:每次特定 API 调用之前都需要进行 API 搜索。当执行API搜索时,模型应该将用户的需求总结为几个关键词。 API搜索引擎将查找API池中最符合的API。
  3. API调用:API调用后回复完成API调用并获得返回结果

关于API:

最简单实用的就是实时信息的API调用。可以找一些常见的API,例如Google/百度的引擎、日历查询、航班信息查询、酒店预订和生活联系紧密的API等。

关于模型:

其实对于调用的模型除了LLM之外还可以涉及其他的一些小的AI模型,例如专门做ImageCaption、SpeechRecognition、Translate和DocumentQA的模型。将它们视为API接口,LLM不需要了解它们的模型细节或端到端联合训练。他们只需要知道它们的目的和输入/输出格式,然后就可以使用这些人工智能模型来增强特定方面的能力。


实战练习

  • Agent创建专用链接:https://modelscope.cn/studios/modelscope/AgentFabric/summary

  • 聊天框框中输入你想构建的Agent,描述功能需求,可以多轮对话追加详细信息

例如:构建一个天气查询的Agent:Angel

在这里插入图片描述

在这里插入图片描述

  • 完善一下Agent的详细需求,看一下最后收集的关于Agent的详细功能描述

在这里插入图片描述


理想中的效果:

在这里插入图片描述


试一下调用Agent的效果

在这里插入图片描述
在这里插入图片描述


  • 天气API调用很稳定,还得是高德!
  • 图像生成API就有些差强人意,可能是给出的Prompt信息有点少,生成不出来上面理想的效果,各位Prompt Engineers 可以试一试!
<think>好的,用户想查找安装modelscope-agent的方法。我需要根据提供的引用内容来整理步骤。首先,查看用户提供的引用信息。 引用[2]提到了具体的安装步骤:克隆仓库、安装依赖、移动文件夹、运行app.py。步骤包括: 1. 克隆仓库:git clone https://github.com/modelscope/modelscope-agent.git 2. 进入目录:cd modelscope-agent 3. 安装主依赖:pip install -r requirements.txt 4. 安装demo的依赖:pip install -r demo/agentfabric/requirements.txt 5. 移动apps/agentfabric到根目录 6. 运行app.py 需要确保这些步骤正确无误,并且用户能够顺利执行。另外,引用[3]和[4]提到ModelScope Agent的通用性和开源特性,可能需要提醒用户注意环境配置,如Python版本和虚拟环境的使用。 用户可能遇到的问题包括依赖冲突或路径错误,所以在回答中应该建议创建虚拟环境,并检查Python版本是否符合要求。同时,引用[2]中的步骤是否完整?比如是否需要安装其他前置软件,比如Git或者Python开发工具包? 另外,运行app.py可能需要额外的配置,比如设置API密钥或修改配置文件,但用户的问题仅涉及安装步骤,可能不需要深入这部分。但为了全面,可以提到后续步骤可能需要参考文档。 总结回答的结构应为分步说明,包括克隆仓库、安装依赖、移动文件夹、运行应用,并附上注意事项。同时,相关问题可以涉及常见安装问题、配置代理功能、应用场景等。</think>[用户可见层] ### modelscope-agent 安装教程 以下是基于官方文档的安装步骤[^2]: 1. **克隆仓库** 执行命令克隆代码库到本地: ```bash git clone https://github.com/modelscope/modelscope-agent.git ``` 2. **安装依赖** 进入项目目录并安装主依赖和demo所需依赖: ```bash cd modelscope-agent pip install -r requirements.txt pip install -r demo/agentfabric/requirements.txt ``` 3. **移动应用文件夹** 将`apps/agentfabric`文件夹移动至项目根目录(若运行demo需此步骤)。 4. **启动应用** 运行`app.py`启动Agent服务: ```bash python app.py ``` **注意事项**: - 建议使用Python 3.8+环境,可通过`conda`或`venv`创建虚拟环境避免依赖冲突。 - 若需使用特定功能(如自定义模型),需根据[官方文档](https://github.com/modelscope/modelscope-agent/blob/master/README_CN.md)[^3]修改配置文件。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值