大模型开发 - 一文搞懂人工智能数学基础（下）：概率论

最新推荐文章于 2024-10-03 14:54:57 发布

功城师

最新推荐文章于 2024-10-03 14:54:57 发布

阅读量1k

点赞数 17

文章标签：大模型入门大语言模型大模型人工智能 AI大模型大模型开发自然语言处理

本文链接：https://blog.csdn.net/qingkahui24689/article/details/141635016

版权

不懂概率论，何以寻找模型最优参数？

本文将从贝叶斯统计、马尔可夫链、回归分析 三个方面，带您一文搞懂人工智能数学基础（下）：概率论。

概率论

**__**一、**__****__**_**_**_**_**_**_**贝叶斯统计**_**_**_**_**_**_**__**

频率学派与贝叶斯学派： 频率学派侧重通过大量数据推断概率，强调客观频率；而贝叶斯学派则基于先验知识，通过新数据更新概率，强调主观信念的更新。

频率学派与贝叶斯学派

频率学派：世界是客观的，概率是事件在长时间内发生的频率。必须通过大量独立采样来获得统计均值。不主张先给出一个主观的先验概率或假设。

古典概率模型

概率的古典定义

贝叶斯学派： 概率是一种信念度，可以有主观的先验概率。通过观察新的数据来不断更新先验概率，使之逼近客观事实。

贝叶斯算法

条件概率：在事件A发生的条件下，事件B发生的条件概率。

条件概率的定义

条件概率的计算公式

全概率公式：计算一个事件发生的总概率的方法，它通过将事件划分为若干个互斥的子事件，并计算这些子事件的概率和条件概率的乘积之和来得到。

全概率公式

贝叶斯公式：贝叶斯公式是用于更新某个事件在给定新证据下的概率的工具，它结合了先验概率和条件概率来计算后验概率。

贝叶斯公式

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉[CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）]()👈

_**二、**__**_**_**马尔可夫链**_**_**_

马尔可夫链： 描述状态空间中从一个状态到另一个状态转换的随机过程，其下一状态的概率分布仅由当前状态决定，具有无记忆性。

马尔可夫性质
马尔可夫链的核心逻辑， 未来只与现在有关，而与过去无关。

隐马尔可夫模型（HMM）： 一种强大的统计工具，通过描述隐藏的马尔可夫链和观测序列之间的关系，其核心组成部分包括隐藏状态、观测序列以及相关的概率分布和矩阵。

隐马尔可夫模型（HMM）

转移矩阵和转移图： 转移矩阵是二维数组，明确状态间转移概率；转移图直观展示状态转移关系，便于理解和分析。

转移矩阵： 是一个二维数组，其中每个元素表示从一个状态转移到另一个状态的概率。

转移矩阵

转移图： 是一种可视化工具，用于直观地展示状态之间的转移关系。

转移图

_**三、**__**_**_**回归分析**_**_**_

一元线性回归分析： 一种通过单一自变量来预测因变量变化的统计分析方法，旨在找出两者之间的线性或非线性关系。

一元回归分析定义

一元线性回归模型： 通过单个自变量预测因变量，并假设两者之间存在线性关系的数学模型。

一元线性回归模型

a, b是两个待定参数，a称为截距(intercept)，b称为回归系数(coefficient)，也就是数学中直线的截距；J称为损失函数(lost function)。一元回归分析就是要寻找合适的参数a, b，使得损失函数最小。

求解参数a,b：

将回归模型代入损失函数J，将J分别对a和b求偏导数

令偏导数为零，求解整理

多元线性回归分析： 利用多个自变量来预测因变量，并假设它们之间存在线性关系的统计分析方法。

数据集： 包含一组相关数据的集合

数据集

回归方程：程描述了因变量与自变量之间的数学关系

回归方程

损失函数：用于衡量模型预测值与真实值之间的差异

损失函数

在大模型时代，我们如何有效的去学习大模型？

现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。
在这里插入图片描述

掌握大模型技术你还能拥有更多可能性：

• 成为一名全栈大模型工程师，包括Prompt，LangChain，LoRA等技术开发、运营、产品等方向全栈工程；

• 能够拥有模型二次训练和微调能力，带领大家完成智能对话、文生图等热门应用；

• 薪资上浮10%-20%，覆盖更多高薪岗位，这是一个高需求、高待遇的热门方向和领域；

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术，也_想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。为了让大家少走弯路，少碰壁，这里我直接把都打包整理好，希望能够真正帮助到大家_。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。

在这里插入图片描述

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。