机器学习--生成学习算法

一支程序媛

于 2017-07-01 16:16:02 发布

阅读量692

点赞数 1

分类专栏：机器学习，监督学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zkyzq/article/details/74066938

版权

这篇博客介绍了生成学习算法，重点讲解了高斯判别分析（GDA）的基本原理和公式，以及在连续特征上的应用。同时，讨论了朴素贝叶斯分类器，包括其假设、参数估计和在离散特征上的应用。文中还提到了拉普拉斯平滑在处理训练集中未出现的特征值时的作用。

摘要由CSDN通过智能技术生成

这次的课Ng讲了一种与之前判别类算法不同的学习算法，称为生成学习算法(Generative Learning algorithms)。

一、简介

比如一个二分类问题，判别一种动物是大象还是狗，特征量有腿长，尾巴长，毛发浓密程度，体型等。有一批数据样本，之前的方法是对所有的数据建立模型，学习特征量和标签之间的关系，对于新输入的一个特征量，通过最优参数奠定的学习模型得出它是属于大象还是狗。而今天所讲的生成学习算法的主要思想是，首先我们来看大象,我们可以对大象的样子建立一个模型，再对狗子建立一个模型，最后为了分类一种新的动物，我们可以将它分别与大象和狗子的模型进行匹配，都算出匹配结果，看看像那个更多一点。即，对p(y|x)直接学习建模的方法是判别类算法，比如逻辑回归；而对p(x|y)和p(y)建模再利用贝叶斯公式算出p(y|x)的成为生成类算法。如果y=0代表动物是大象而y=1代表动物是狗子，那么对p(x|y=0)建模就是对所有大象的特征建模，狗子类似。之后，我们可以用下面的公式来计算p(y|x):

其中分母为：

但是要注意的是，如果我们只是要求最大的p(y|x)时的y，那么p(x)其实是不需要的，因为：

二、高斯判别分析

2.1.高维正态分布简介

GDA(Gaussian discriminant analysis)是我们接触的第一个生成类学习方法，在这个方法中，我们假设p(x|y)是服从多维正太分布的，分布概率密度为：

其中u为分布的均值向量，为分布的方差阵。

下面几幅图是一些二维正态分布的例子：

均值都是零向量，中间的方差最小，右边的方差最大。方差就反应了数据集的离散程度。这些图形都是对称的，所以协方差矩阵均为对角阵。下面三个例子的协方差矩阵的对角线元素不为0，所以其数据是互相关的：

从左到右协方差矩阵分别为：

2.2.高斯判别分析(GDA)

当我们的分类问题的特征数据

最低0.47元/天解锁文章

一支程序媛

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。