Agent 如何更有用

谁怕平生太急

已于 2024-05-21 19:44:08 修改

阅读量1k

点赞数 28

分类专栏： Agent 文章标签： Agent

于 2024-05-21 19:39:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jinselizhi/article/details/139087210

版权

Agent 专栏收录该内容

14 篇文章 2 订阅

订阅专栏

先看这篇会更连贯 Agent的记忆能力

LLM的基础能力

1、复杂任务的规划和分解

2、遵循复杂指令

3、自主使用工具

4、减少幻觉

一两个人就能开发的有用AI

AI的优势：长文本的阅读理解能力、广阔的知识面。

1、导游：GPT-4知道很多著名景点，还能做行程规划。

2、企业ERP助手：对 需求描述能力、架构设计能力、技术表达能力 有很强的要求。What - Why - How 有条理的讲清楚自己做的东西。

3、大模型采集数据：本质是利用了大模型阅读速度比人快的特点。不需要定制开发。

4、手机语音助手：RPA（机器人流程自动化）比如腾讯的AppAgent，可以自动学习操作 Telegram、Youtube、Gmail、Lightroom等多款app。RPA的主要难点是学习使用app的过程。「app的各种功能、操作序列的记录等」

5、会议和生活记录器

Zoom：包括将会议语音内容实时转录成文字；根据实时转录的文字，将会议所讲过的内容做总结；根据实时转录的文字，用户提出问题，大模型给出问题的回答。

Rewind.AI 的录屏和录音吊坠：本地化算力或者隐私计算是解决隐私问题的必由之路

解决复杂任务和使用工具

记忆是有趣和有用 AI 都必须具备的公共能力。

情感是有趣 AI 需要的。

而解决复杂任务和使用工具更多是有用 AI 所需的能力。

（1）CoT：先想后说

（2）复杂任务的规划和分解

从 Agent-FLAN论文可知，这一步相对于检索、理解要更难，是模型基础能力问题，需要依靠 scaling law。另外从系统角度思考，与用户交互式解决复杂任务是很重要的，AI遇到困难要及时求助。

（3）自动调用多种工具分步求解

a.按照流程调用工具的方法是 few-shot（在prompt中给AI提供几个样例任务的执行过程）

b.让AI学会使用上万种工具：方法一是SFT、pretrain；方法二是RAG+prompt

减少幻觉的工程方法

消除幻觉的根本方法是 scaling law，靠基模进步。但也有一些工程方法来缓解：

（1）事实性校验

大模型生成 - RAG（搜索引擎、向量数据库、倒排索引、知识图谱等）找出与回答内容匹配的原始语料 - 前两步一起送给大模型，让LLM判断回答与原始语料是否相符

这种方法只能发现 编造事实类的幻觉，不能发现答非所问类的幻觉。

（2）多次生成

类似投票的思想，多次生成同一问题的回答，然后一起给到大模型，让大模型挑出最一致的结果。

这种方法可以解决偶发的幻觉问题，但不能解决系统性偏差。

开源模型的护城河

微调：基于微调而非prompt构建更像一个人的agent
推理优化：降低成本和延迟
多模态：语音、图片、视频理解和生成
基于Embedding的记忆：例如LongGPT
流式推理（例：多个Agent语音聊天）：基于KV Cache的工作记忆和流式推理
本地化部署：数据安全需求的to B场景
终端设备：有隐私需求的个人终端设备
机器人

未记录的

成本
数字生命
去中心化
详见 AI Agent更有趣还是更有用

谁怕平生太急

关注

28
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

谁怕平生太急 CSDN认证博客专家 CSDN认证企业博客

码龄9年

163: 原创

2万+: 周排名

1万+: 总排名

15万+: 访问

: 等级

3193: 积分

389: 粉丝

574: 获赞

8: 评论

623: 收藏

私信

关注

热门文章

分类专栏

大模型 21篇
读书笔记 5篇
算法基础 9篇
中医 5篇
刷题 3篇
阅读 52篇
Agent 14篇
大神 2篇
生活 13篇
RAG 1篇
架构 1篇
数据 1篇
开发 27篇
读文章
百面机器学习的读书笔记 5篇

最新评论

Qwen2-VL论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
LangGraph介绍
青青草原一只狼: 博主有找到LangGraph的标准实例吗
最简单的网络
谁怕平生太急: import torch from torch.utils.data import DataLoader, Dataset import numpy as np # 自定义数据集 class CustomDataset(Dataset): def __init__(self, data, labels): self.data = data self.labels = labels def __len__(self): return len(self.data) def __getitem__(self, idx): sample = self.data[idx] label = self.labels[idx] return sample, label # 创建示例数据 data = np.random.random((100, 3, 32, 32)) labels = np.random.randint(0, 10, 100) # 创建数据集和数据加载器 dataset = CustomDataset(data, labels) dataloader = DataLoader(dataset, batch_size=8, shuffle=True, num_workers=2)
大模型之DPO
谁怕平生太急: DPO开始训练时，reference model和policy model都是同一个模型，只不过在训练过程中reference model不会更新权重。
多模态模型基础
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。