KwaiAgents论文笔记

最新推荐文章于 2024-09-17 22:35:40 发布

Saber_Alpha

最新推荐文章于 2024-09-17 22:35:40 发布

阅读量740

点赞数 17

分类专栏：论文笔记大模型文章标签：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Dar_Alpha/article/details/139700393

版权

大模型同时被 2 个专栏收录

5 篇文章 1 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

摘要

人比较擅长批判性思维，计划，和反思。作者想要agent也会这一套然后能够实现一个广义的信息搜索（理解用户的查询，行为准则，引用外部文档）。

介绍

贡献：

提出了KAgent-sys，将plan tool reflexion profile等集成在一起
引入了一套kagentlm框架来微调优化agent，探索一般的llm如何用于信息搜索
引入了一套评估基准：KagentBench
能够解决传统搜索引擎面对长尾或者趋势问题上所存在的局限性

系统组成

Memory

知识Memory：外部资源（主要来自web搜索的结果）

会话Meomory：历史对话

任务Memory: 执行了什么任务，获得了什么结果

每一个memory的长度都是固定的，会使用不同的检索机制（embedding, es）从各个memory中提取出相关片段。最后组合在一起。每个memory还分为正例和负例。

对于Knowledge memory会增加召回结果的数量.

Conversation memory 只考虑和query相关的上下文的历史对话

Task memory 只取最近的task相关的信息

工具库

搜索

hybrid_search

执行两个任务：

使用搜索引擎api来获取相关的网页，每个网页都带有标题，URL和简要摘要
通过主实体的链接来识别主实体，获取wiki的描述，并搜集wiki中的简洁的描述，aspect以及相关的视频

时间意识

发现将时间戳合并到提示词中对于时间感知的问题回答仍然不是最优的，还是有过时信息的传播。

所以引入了几个时间感知工具： 1. 日历（处理日期范围，提供公历和阳历的详细信息） 2. 节假日，给定一个日期范围，返回值得关注的节日。 3. time_delta, 计算两个时间错之间的duration 4. 天气，需要一个位置和日期范围来提供天气细节。

其他

还集成了一些高质量的开源工具，来自其他的ReAct, autogpt，toolllama, modekscope Agent框架。

Agent Tuning

模板制作

Re-Act, Auto-GPT, ToolLlama, ModelScope-agent这些agent框架共有结构

Profile, 详细说明LLM的角色
instruction，包含约束和agent动作序列，例如：迭代不超过5次
tools，概述使用工具的格式，如：包含函数名，描述，参数细节的json格式
memory，对外部知识，过去任务和对话历史的整合
goal, 用户查询和需求的合并
format，说明agent该如何制作响应和管理迭代，例如：返回一个带有任务名称，工具名称，参数的json对象

作者从各种来源(web, sharegpt)搜集了各种query，然后对query进行聚类，最后借助gpt4来生成各种类型query的模板。（如果做比较开放的系统，这种query的制作方式可以学习一下）。除此之外，还用了其他agent框架的模板。

模板验证

使用gpt对结果进行评分，t表示生成的模板，rc表示候选结果，k表示共有k-1个开源模板（来源于一些开源框架ReACT，autogpt,modescope, toolllama）和一个Gpt生成的模板， sigmoid是一个gpt负责打分的函数

数据集

训练数据集：

聚合和生成其他框架（auto-gpt等）中的工具和查询来编译的，生成了大量的模板，然后按照上述的阈值进行一个过滤。

除了这些，为了不丢失掉大模型的通用能力，还整理了来自不同领域的43099个查询，如开放域问答、聊天、角色扮演、数学等。

bench数据集：

bench的严格按照查询、工具、模板和内存元素来制作，参考上方的hybrid_search。（具体我也没怎么看懂）。

这块做了不少人工标注细化，确保高质量的基准

评估

案例

当查询安东内拉和梅西之间的年龄差异时，会出现两个问题：“梅西和他的妻子”的趋势会使搜索结果偏向于新闻文章，这些新闻文章会用不相关的内容（如关系时间表）吸引用户参与

关注

17
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Saber_Alpha CSDN认证博客专家 CSDN认证企业博客

码龄6年

11: 原创

52万+: 周排名

11万+: 总排名

1万+: 访问

: 等级

191: 积分

377: 粉丝

70: 获赞

15: 评论

93: 收藏

私信

关注

热门文章

分类专栏

大模型 5篇
论文笔记 3篇
docker 1篇
TTS 2篇
linux 1篇

最新评论

使用sambert-hifigan微调实现个性化声音定制
yskany: 大佬请问用这个能不能控制音频文件的语速
KwaiAgents论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
使用sambert-hifigan微调实现个性化声音定制
termiliter: 版本没有问题，windows好像是用不了
CharacterLLM论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
bge论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Saber_Alpha 你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。