生成模型和判别模型（一）

xwh_2023

已于 2023-04-13 16:52:23 修改

阅读量146

点赞数

文章标签：机器学习人工智能

于 2023-04-13 16:38:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aaaxwh/article/details/130126586

版权

生成模型是机器学习的一种方法，涉及条件概率和贝叶斯公式。在确定模型如高斯分布后，使用极大似然函数作为评价准则来寻找最佳参数。文章举例介绍了如何通过极大似然估计求解两类样本的高斯分布参数，并提到了朴素贝叶斯模型，讨论了生成模型的优缺点，包括其在处理大量样本时的快速收敛性。

摘要由CSDN通过智能技术生成

首先，机器学习可以理解为找到一个函数去做分类或者回归

其次，机器学习有如下三个步骤：

step 1: 确定模型或者函数集，比如线性模型 $y=wx+b$

step 2: 给出模型的评价准则（损失函数），比如误差平方和、交叉熵

step 3: 从函数集中选出一个最佳的函数，即选择最佳的一组模型参数使得损失函数达到最小

一、什么是生成模型

1.条件概率公式

$P(A|B)=\frac{P(AB)}{B}$

2.贝叶斯公式

$P(A_{i}|B)=\frac{P(B|A_{i})P(A_{i})}{\sum\limits_{j} P(B|A_{j})P(A_{j})}$

3.生成模型

假设 $C_{1}$ 表示第一类， $C_{2}$ 表示第二类，则对于给定的 $x$ 生成模型如下：

参考上述提到的机器学习三步骤，在这里第一步我们选择了生成模型，那么如何选择评价准则或者损失函数来定义最佳的模型呢？

在这里最佳的函数或者模型可以理解为样本数据的分布的参数，比如已知数据样本服从正态分布，那么这里的最佳指的就是在所有的均值 $\mu$ 和方差 $\sigma$ 中， $\mu^{*}$ 和 $\sigma^{*}$ 对应的正态分布产生该样本的概率最大。

step 1：生成模型

step 2 & step 3：评价准则：极大似然函数（maximum likelihood）

高斯概率密度函数：

其中 $x \in R^{D}$

假设两类样本都服从高斯分布，且每一类中的样本都是独立采样，第一类有79个样本，第二类有61个样本

接下来

1）由两类样本分别求出对应的两个高斯分布，即两组均值向量、协方差矩阵

方法：极大似然

以第一类的均值向量和协方差矩阵求解为例：

按照该方法求解出 $(\mu^{1},\Sigma^{1})$ 、 $(\mu^{2},\Sigma^{2})$

2）代入生成模型

4.经典的生成模型之一：朴素贝叶斯（Naive Bayesian Model）

朴素贝叶斯分类（NBC）是以贝叶斯定理为基础并且假设特征条件之间相互独立的方法

5.生成模型的优缺点

优点;

（1）将先验知识考虑进去

（2）实际上带的信息要比判别模型丰富

（3）当样本数量较多时，生成模型能够更快地收敛到真实模型

缺点：

实践中多数情况下判别模型效果会更好

目录

一、什么是生成模型

1.条件概率公式

2.贝叶斯公式

4.经典的生成模型之一：朴素贝叶斯（Naive Bayesian Model）

5.生成模型的优缺点

参考资料：李宏毅老师机器学习课程

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
生成模型和判别模型（一）

假设表示第一类，表示第二类，则对于给定的生成模型如下：参考上述提到的机器学习三步骤，在这里第一步我们选择了生成模型，那么如何选择评价准则或者损失函数来定义最佳的模型呢？在这里最佳的函数或者模型可以理解为样本数据的分布的参数，比如已知数据样本服从正态分布，那么这里的最佳指的就是在所有的均值和方差中，和对应的正态分布产生该样本的概率最大。step 1：生成模型step 2 & step 3：评价准则：极大似然函数（maximum likelihood）高斯概率密度函数：其中。
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。