大模型知识总结

大模型知识总结

1. 重点论文

论文列表:https://zhuanlan.zhihu.com/p/622541777

2. 大模型原理

2.1 基本模型及原理

-transformer:链接

2.2 大模型学习与推理的流程

2.3 预训练

2.4 微调

2.5 RLHF

3. 模型工程

大模型-模型工程指如何在生产环境通过大模型解决问题的工程模型,以及所使用的技术(个人定义,没搜到特别合适的)。

3.1 agent

  • https://learn.microsoft.com/en-us/semantic-kernel/agents/
  • https://lilianweng.github.io/posts/2023-06-23-agent/

目前主要使用的工程模型是AI Agent(AI Agent是NLP领域一个研究方向,随着大模型技术火起来了,感兴趣的话可以追溯下大模型之前的agent论文)。在目前大模型背景下,agent指基于基座模型(如GPT,GLM等)能力,结合一系列优化技术,实现的可以自动化解决某一领域问题的对话机器人。agent主流结构(引用自链接),以及和基座模型的区别(引用自链接)见下图:

agent架构
agnet roadmap

agent场景的模型工程技术主要有:记忆数据库(Memory,一般为RAG)、工具使用(Tool Learning)、规划能力(Planning,如思维链等)等。在下文介绍。

3.2 prompt&prompt工程

prompt工程是大模型工程实现中绕不开的一环,在实现agent之前,我们都需要通过prompt对我们要实现的机器人做基本设定:
在这里插入图片描述
除此之外,由于大模型具有In-Context Learning能力(具体见上文GPT3论文)。我们可以在上述prompt中,应用最简单的模型工程,在prompt中提供一些学习样例,使模型能够更好地回答问题,如:

你是智慧搜索引擎,负责根据用户提出的问题,在百度搜索引擎中找到最接近的答案,并呈现给用户。你的角色是辅助用户获取所需信息,提高信息获取效率。你的能力有:
1. 快速检索:你能在短时间内从百度搜索引擎中找到与用户问题相关的答案。
2. 精准匹配:你能够准确识别用户问题,并找到最佳答案。
3. 智能呈现:你将以简洁明了的方式将答案呈现给用户。

以下是一些对话的样例:
1. 问题:*** 回答:***
2. 问题:*** 回答:***

除此之外,我们还可以在prompt中加入记忆召回,思维链等,这些就是上文提到的agent的技术(它们本质上就是prompt工程)。这些技术会在下文介绍。

3.3 Memory

大模型中的记忆,就是指模型工程通过数据库,维护当前agent的记忆/知识等数据,在用户对话时,基于用户输入的上下文,通过一定规则去检索数据库中的内容,将检索得到的内容拼接在prompt中,优化对话的体验。

3.3.1 长短期记忆

相关论文:Generative Agents: Interactive Simulacra of Human Behavior, 2023.04, Stanford

Agents感知他们的环境,当前agent所有的感知(完整的经历记录)都被保存在一个名为"记忆流"(memory stream)中。
当每次agent做出动作时,系统检索相关的记忆,然后使用这些检索到的行为来决定下一个行为。这些检索到的记忆也被用来形成长期计划,并创造出长期记忆,这些都被输入到记忆流中以供未来使用。

3.3.2 RAG

3.4 Tool Learning

3.5 Planning

3.6 模型部署

3.7 推理优化

4. 工程实践

4.1 客服agent技术选型

  • 9
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
校园失物招领系统管理系统按照操作主体分为管理员和用户。管理员的功能包括字典管理、论坛管理、公告信息管理、失物招领管理、失物认领管理、寻物启示管理、寻物认领管理、用户管理、管理员管理。用户的功能等。该系统采用了Mysql数据库,Java语言,Spring Boot框架等技术进行编程实现。 校园失物招领系统管理系统可以提高校园失物招领系统信息管理问题的解决效率,优化校园失物招领系统信息处理流程,保证校园失物招领系统信息数据的安全,它是一个非常可靠,非常安全的应用程序。 ,管理员权限操作的功能包括管理公告,管理校园失物招领系统信息,包括失物招领管理,培训管理,寻物启事管理,薪资管理等,可以管理公告。 失物招领管理界面,管理员在失物招领管理界面中可以对界面中显示,可以对失物招领信息的失物招领状态进行查看,可以添加新的失物招领信息等。寻物启事管理界面,管理员在寻物启事管理界面中查看寻物启事种类信息,寻物启事描述信息,新增寻物启事信息等。公告管理界面,管理员在公告管理界面中新增公告,可以删除公告。公告类型管理界面,管理员在公告类型管理界面查看公告的工作状态,可以对公告的数据进行导出,可以添加新公告的信息,可以编辑公告信息,删除公告信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值