AI大模型全栈工程师入门学习笔记

最新推荐文章于 2024-09-26 17:23:00 发布

_Evelyn

最新推荐文章于 2024-09-26 17:23:00 发布

阅读量510

点赞数 19

分类专栏：大模型文章标签：人工智能 chatgpt

本文链接：https://blog.csdn.net/weixin_44861366/article/details/141337473

版权

大模型专栏收录该内容

1 篇文章 0 订阅

订阅专栏

AI大模型全栈工程师入门学习笔记

1.大模型应用开发基础

1.1.核心

我们要记住一个观点：把AI当人来看。把AI当人来看。把AI当人来看。
我们将从原理、实践、认知三个方面学习大模型。

大模型AI应用全栈开发知识体系

1.2.AI的一些定义

什么是AI？
一种观点：基于机器学习、神经网络的是AI，基于规则、搜索的不是AI。
大模型是什么？
大模型=大语言模型=LLM（Large Language Model）
建议用哪些大模型？
老师推荐用ChatGPT，版本越新越好
大模型有什么用？
分类、按格式输出、聚类、持续互动、技术相关问题
可能一切问题都能解决，所以是AGI
大模型怎么生成结果的？
其实就是根据上文，猜下一个词，这个算法叫transformer
Token是什么？
大模型在进行交互的过程中，会把所有文本拆成token
大模型阅读了人类说过的所有话，这叫“学习”，然后把一串token后面跟着不同token的概率记下来，这就是“参数”，亦即权重。
给他若干个token，他能算出概率最高的token，这就是“生成”
AI为什么会产生幻觉？
大模型不能判断结果的正确性，只能根据概率去生成，所以他会一本正经胡说八道。
彩蛋：
ChatALL，把市面上很常见的一些大模型综合到一起，可以用它体验Bing Chat或者ChatGPT。

1.3.大模型的应用架构

1.3.1.典型业务架构

在这里插入图片描述
AI Embedded模式：人的工作占大多数，AI只完成其中一点工作。
AI Copilot模式：人是主驾驶，AI是副驾驶。人类主控，AI帮助。
AI Agent模式：这个基本没人什么事了，AI自主决定接下来干什么，AI决策。

1.3.2.技术架构

1、纯Prompt
你说一句我说一句
在这里插入图片描述

2、Agent+Function Calling
AI主动提要求
Function Calling是AI要求执行某个函数
在这里插入图片描述
3、Embedding+向量数据库

4、Fine-Tunning(微调)

2.Prompt工程

2.1.什么是提示工程（Prompt engineering）

Prompt就是你发给大模型的指令，比如“讲个笑话”
Prompt是AGI时代的“编程语言”
我们要在知道“大模型只会基于概率生成下一个字”的原理上，要知道怎么提升指令有效的概率

2.2.使用Prompt的目的是什么

1.获得具体问题的具体结果
2.固化一套Prompt到程序中，成为系统功能的一部分，比如“每天生成公司经营情况的简报”

2.3.Prompt调优

Prompt是个持续迭代的过程，需要不断调优
如果知道训练数据是怎样，参考训练数据来构造Prompt 是最好的。比如你知道ta爱读红楼梦，就跟ta聊红楼梦
不知道训练数据怎么办？
1、看ta是否主动告诉你，ChatGPT对markdown格式友好，claude对XML友好
2、只能不断试
高质量Prompt的核心要点：具体、丰富、少二义性
如果底层大模型换了，Prompt要不要重新调优？要。

2.4.Prompt的典型构成

1.角色：给AI定义一个最匹配任务的角色，比如“你是一个面试官”
2.指示：描述任务
3.上下文：给出与任务相关的其他背景信息（尤其在多轮交互中）
4.例子：给出必要的实例，学术中称为one-shot learning，few-shot learning或in-context learning；实践证明其对输出正确性有帮助
5.输入：给出明确的标识任务的输入信息
6.输出：输出格式描述

角色本来是非必要，但后来被证实很有用，就被训练者带入到了训练中。
因为：大模型对Prompt开头和结尾的内容更敏感
其实先定义角色，就是开头把问题域收窄，减少二义性

2.5.设定一个业务场景来讲解上述知识

业务场景：办理流量包的智能客服

2.6.对话系统的基本模块（简介）

在这里插入图片描述
比如AI作为办理流量包的只能客服，面对用户的提问，各环节执行的动作如下：

那么针对对话系统的各个环节，如何对prompt进行优化？
NLU：语义理解
1.任务描述+输入

2.约定输出格式
在这里插入图片描述
3.把描述定义的更精细

4.加入例子：让输出更稳定
在这里插入图片描述

DST：状态跟踪
在prompt中加入上下文（解决多轮对话的问题）
如：
“今日移动发展”
“昨天呢？”
在这里插入图片描述

NLG和对话策略
我们先把刚才的能力串起来，构建一个简单的机器人
1.将垂直知识加入prompt，以使其准确回答

2.增加约束：改变语气、口吻

3.用例子实现统一口径

总结：