AI大模型学习（1）

农夫码仔

已于 2024-03-08 17:24:22 修改

阅读量392

点赞数 9

文章标签：人工智能学习

于 2024-03-05 09:46:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35376756/article/details/136469903

版权

Agent

Agent：大模型的插件

Agent = 大模型 + 插件 + 执行流程，是大模型能力的外延

智能带来的框架：LLM-based Agent，包含三个组成部分：控制端（brain），感知端（Perception）和行动端（Action）

控制端：Brain，大模型的大脑，是Agent的核心

自然语言交互
知识
记忆力
推理和规划能力
迁移性和泛化性。情景学习和持续学习。见人说人话，见鬼说鬼话

感知端：Perception，大模型的耳朵和眼睛

文本输入
视觉输入
听觉输入
其他输入

行动端：Action，大模型的手和脚

文本输出
其他模型

LLAMA Index：辅助模型的记忆力。知识的外挂

列表索引
向量存储索引
树索引，把数据和知识以不同的结构存储起来，然后通过不同的检索方式获取知识。
关键词索引
知识图谱索引

COT：chain of though

TOT：搜索、评估、回溯

总结：

Agent，

给大模型加外挂

1、外挂辅助输入，例如：外部调用日历

2、外挂输出。日期：2023-12-21，目标：挑起，调用工具：气象接口

思维链条

把复杂的问题进行拆解，不指望大模型一次回答出来，多调用几次大模型，解决复杂问题

如果说大模型是电池：核心能力，

则agent就是一辆电动车：最终交付，最终产品

Agent的缺点：

1、依赖大模型的核心能力，大模型本身够强大才行

2、链路过长，某一个环节出错，前功尽弃

3、多次调用模型，效率不高

4、迁移能力弱，换模型需要重新写提示词

5、能力强弱，取决于写提示词的水平

大模型性能力是有上限的，端到端虽然理想，但是复杂问题很难解决，Agent这种拆解方式，可能会流行

羊驼系列大模型

LLaMA（美洲驼）模型

相比之前的大模型，LLaMA完全是在公共开源预训练数据上训练的
推理效率也是LLaMA的一个亮点，可以在蛋单卡V100完成推理

关键网址：

https://huggingface.co/

训练数据同GPT，目标打造类似安卓的生态圈。GPT类型于IOS

AIPaca模型

基于LLaMA微调而来的全新模型（套壳），大模型的屌丝化，仅需600美元成本

Vicuna模型

比对情况

国产大模型

华驼，百川大模型，文心一言（原创）等

LLaMA2.0

关注

9
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
AI大模型学习（1）

Agent：大模型的插件Agent = 大模型 + 插件 + 执行流程，是大模型能力的外延智能带来的框架：LLM-based Agent，包含三个组成部分：控制端（brain），感知端（Perception）和行动端（Action）控制端：Brain，大模型的大脑，是Agent的核心感知端：Perception，大模型的耳朵和眼睛行动端：Action，大模型的手和脚LLAMA Index：辅助模型的记忆力。知识的外挂TOT：搜索、评估、回溯总结：Agent，1、外挂辅助输入，例如：外部调用日历。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。