分类

最新推荐文章于 2019-01-24 10:11:45 发布

奋斗啊哈

最新推荐文章于 2019-01-24 10:11:45 发布

阅读量454

点赞数

分类专栏：机器学习算法文章标签： logistic回归朴素贝叶斯最大熵分类

本文链接：https://blog.csdn.net/foolsnowman/article/details/52052501

版权

机器学习算法专栏收录该内容

17 篇文章 1 订阅

订阅专栏

从概率的角度讲，以分类为例，机器学习的目的是从训练数据中学习并估计后验概率 $P(c|X)$ ,其中 $X$ 表示训练数据集， $c$ 表示预测的类别。如果直接对 $P(c|X)$ 的值进行估计，而不考虑训练数据所服从的分布，这种方法产生的模型为判别模型。从这个角度讲，线性判别模型（如logistics回归）、SVM、多层网络都属于判别模型。相反，如果对 $P(c|X)$ 的值进行估计的过程中考虑了数据所服从的分布，如假设 $P(X)$ 、 $P(X，Y )$ 或其他变量服从某种分布，那么将会得到生成模型，如贝叶斯分类模型。
对于生成模型来说，当假设了数据变量服从某种概率分布时，概率分布模型的学习过程变成了参数估计过程。

广义线性模型

一般线性回归

logistic回归

对 $p(Y|X)$ 和 $X$ 之间的关系建模。

朴素贝叶斯分类

朴素贝叶斯分类的主要思想是：对于待分类数据 $X=(x_1,x_2,...,x_m)$ ，计算使后验概率 $p(Y=c_j|X)$ 最大的 $Y$ 的取值，即为数据 $X$ 所属的类别标签 $c_j$ .
后验概率 $p(Y=c_j|X)$ 是通过贝叶斯公式计算的，如下

p (Y = c j | X) = p ( X | Y = c j ) p ( Y = c j ) \sum j p ( X | Y = c j ) p ( Y = c j )

$p(Y=c_j|X)=\frac{p(X|Y=c_j)p(Y=c_j)}{\sum_j p(X|Y=c_j)p(Y=c_j)}$
其中，

p(X|Y=cj) $p(X|Y=c_j)$ 中每个数据

X=(x1,x2,...,xm) $X=(x_1,x_2,...,x_m)$ 包含

m $m$ 个特征，如果假设这些特征是在

Y=cj $Y=c_j$ 条件下是相互独立的，那么

p(X|Y=cj)=∏ip(xi|Y=cj) $p(X|Y=c_j)=\prod_i p(x_i|Y=c_j)$ ,这也是朴素贝叶斯之所以朴素的地方，即在已知分类类别的情况下，假设各个特征之间是条件独立的。

最大熵分类

最大熵分类的原理是对于待分类数据 $X$ ,求输出类别 $Y$ 所服从的分布，根据该分布自然可以得到 $X$ 所属类别。该分布满足的条件是使 $p(Y|X)$ 的条件熵最大。通常，对给定 $X$ 时， $Y$ 服从的分布有一定的限制，这些限制作为问题求解的约束条件。所以最大熵模型为求解如下带约束条件的最大条件熵问题：

这里写图片描述

上述可以根据拉格朗日对偶性转化为极大极小问题。

最大熵模型与Logistics模型
两者均属于对数线性模型，一般使用极大似然估计学习模型中的参数。两者也均可形式化为无约束最优化问题，从而使用梯度下降、牛顿法等求解。
最大熵模型是多分类的Logistics模型。详见这里
最大熵分类与朴素贝叶斯分类
都是求给定输入 $X$ 的情况下，求其类别 $Y$ 所服从的分布。

参考

最大熵模型
1.http://www.cs.cmu.edu/afs/cs/user/aberger/www/html/tutorial/tutorial.html
最大熵模型与Logistics 模型的关系
1. https://www.quora.com/What-is-the-relationship-between-Log-Linear-model-MaxEnt-model-and-Logistic-Regression#
2. Mount J. The equivalence of logistic regression and maximum entropy models[J]. URL: http://www. win-vector. com/dfiles/LogisticRegressionMaxEnt. pdf, 2011.
3. http://www.win-vector.com/blog/2011/09/the-equivalence-of-logistic-regression-and-maximum-entropy-models/

奋斗啊哈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分类

广义线性模型一般线性回归logistic回归对p(Y|X)p(Y|X)和XX之间的关系建模。朴素贝叶斯分类朴素贝叶斯分类的主要思想是：对于待分类数据X=(x1,x2,...,xm)X=(x_1,x_2,...,x_m)，计算使后验概率p(Y=cj|X)p(Y=c_j|X)最大的YY的取值，即为数据XX所属的类别标签cjc_j. 后验概率p(Y=cj|X)p(Y=c_j|X)是通过贝叶斯公式计算的，
复制链接

扫一扫

专栏目录