机器学习-生成学习算法

最新推荐文章于 2023-03-29 17:11:29 发布

拾毅者

最新推荐文章于 2023-03-29 17:11:29 发布

阅读量3.3k

点赞数 1

分类专栏： Machine Learning 文章标签：高斯机器学习 algorithm 生成学习算法 GDA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dream_angel_z/article/details/46288949

版权

Machine Learning 专栏收录该内容

39 篇文章 13 订阅

订阅专栏

本内容主要参考Andrew Ng的机器学习公开课第五讲。

本课内容：

生成学习算法的介绍；
第一个典型的生成学习算法——高斯判别分析；
生成学习算法与之前的判别学习算法的对比；
朴素贝叶斯算法，
Laplace平滑。

1.生成学习算法

学习算法分为两种：一种是判别学习算法（Discriminative Learning Algorithm），简称DLA，另一种是生成学习算法（Generative Learning Algorithm），简称GLA。

$DLA$ 通过建立输入空间X与输出标注{1, 0}间的映射关系学习得到 $p(y|x)$ 。而 $GLA$ 首先确定 $p(x|y)$ 和 $p(y)$ ，由贝叶斯准则得到后验分布 $p(y|x)=\dfrac{p(x|y)p(y)}{p(x)}$ 。通过最大后验准则进行预测，即

arg m a x y p (y | x) = a r g m a x y p ( x | y ) p ( y ) p ( x )

${\arg\ max}_y\ p(y|x)={arg\ max}_y\dfrac{p(x|y)p(y)}{p(x)}$

< = > a r g m a x y p (x | y) p (y)

<script type="math/tex; mode=display" id="MathJax-Element-8"><=> {arg\ max}_y\ p(x|y)p(y)</script>

$if\ p(y)\ is\ uniform:\ <=>\ arg\ {max}_y\ p(x|y)$ .

2.GDA高斯判别分析

当我们有一个分类问题，它的输入特征 $x$ 是一个连续的随机变量，这时我们就使用高斯判别分析模型来建模，模型如下

这里写图片描述

是一个二类问题，所以假设y服从的是伯努利分布，进一步描述模型

这里写图片描述

这里写图片描述

根据模型经过训练得到它的似然函数模型：

这里写图片描述

然后，通过极大似然估计得到变量的估计值如下：

这里写图片描述

这里写图片描述

3.GDA和logistic回归模型的关系

如果我们把 $p(y=1|,x;几个参数)$ 看做是一个函数的变量 $x$ ,我们会发现，这样一个有趣的式子：

这里写图片描述

该式子就是logistic回归模型的一个sigmoid函数。

GDA的优势： 由于有高斯分布的先验信息，如果确实符合实际数据，则只需要少量的样本就可以得到较好的模型。对比之下，logistic回归模型有更好的鲁棒性。

4.朴素贝叶斯Naive Bayes

朴素贝叶斯是通过后验概率来分类的，首先介绍一下贝叶斯公式：

p (X | Y) = p ( Y | X ) p ( X ) p ( Y )

$p(X|Y)=\dfrac{p(Y|X)p(X)}{p(Y)}$
朴素贝叶斯模型对于输入特征

x和输出结果y $x和输出结果y$ ，是假设

x $x$ 条件独立于

y $y$ 的。条件独立也就是下列式子是成立的：

p (x 1, x 2 . . . x n | y) = p (x 1 | y) p (x 2 | y) . . . p (x n | y)

$p(x_1,x_2...x_n|y)=p(x_1|y)p(x_2|y)...p(x_n|y)$

我们根据条件可以得到一个似然函数

这里写图片描述

训练模型（联合概率分布）：给定训练样本 $\{(x^{(i)},y^{(i)});i=1..m\}$
给出极大似然估计值

这里写图片描述

其中：

这里写图片描述

，

这里写图片描述

，

这里写图片描述

预测：输入一个n维特征值 $x$ （如一个词表），由贝叶斯准则得到后验概率

这里写图片描述

由最大后验准则得到分类结果。

关于贝叶斯的一个实例，可以参考我的另外一篇博文：
机器学习算法-朴素贝叶斯Python实现.

5.Laplace平滑

在实际应用中，有时候我们的数据正负样本的比例不均衡，比如正样本的个数为50，负样本为0，这是计算 $p(y=0)=0$ ,这个概率在很多的时候是不科学的，所以使用laplace平滑，将正样本和负样本都增加一个，然后计算负样本的概率就变成了这样

p (y = 0) = n u m N e g + 1 n u m N e g + n u m P o s + 2

$p(y=0)=\dfrac{numNeg +1}{numNeg+numPos+2}$

将它归纳之后的到的公式如下：

这里写图片描述

Reference

Stanford机器学习公开课：http://open.163.com/movie/2008/1/A/R/M6SGF6VB4_M6SGHMFAR.html

本栏目Machine Learning 算法实现持续更新中，欢迎关注：Dream_Angel_Z博客

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。