统计学习方法学习笔记：第六章.逻辑回归与最大熵模型

最新推荐文章于 2020-05-07 14:46:06 发布

小滔滔ahh

最新推荐文章于 2020-05-07 14:46:06 发布

阅读量142

点赞数 1

分类专栏：统计学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44692791/article/details/102548530

版权

统计学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

第六章逻辑回归与最大熵模型

逻辑回归和最大熵模型都是对数线性模型；
模型的学习就是在给定的训练数据集下对模型（这里是 $\color{red}{条件概率分布}$ ）进行 $\color{red}{极大似然估计}$ ；

逻辑回归模型：

$P(Y=k|x)=\frac{e^{w_k\cdot{x}}}{1+\displaystyle\sum_{k=1}^{K-1}e^{w_k\cdot{x}}},k =1,2,3,...,K-1;$

$P(Y=K|x)=\frac{1}{1+\displaystyle\sum_{k=1}^{K-1}e^{w_k\cdot{x}}}$

这里， $(x,w_k)\in{R^{n+1}}$ ；
当K =2 时，就是二项逻辑回归；
二项逻辑回归模型参数的估计：
$L(w)=\displaystyle\sum_{i=1}^{n}[y_ilog(h(x_i)+(1-y_i)log(1-h(x_i)] =\displaystyle\sum_{i=1}^n[y_i(w\cdot{x_i})-log(1+e^{w\cdot{x_i}}]$
这里h(x) 为sigmoid 函数，即上述公式中的模型;可以通过对L(w)求解最大值或者-L(w)的最小值来求解w，可以运用梯度下降、拟牛顿法等进行优化；

最大熵模型：

一般形式：

$P_w(y|x)=\frac{1}{Z_w(x)}exp(\displaystyle\sum_{i=1}^{n}w_if_i(x,y));$

$Z_w(x)=\displaystyle\sum_yexp\sum_{i=1}^{n}w_if_i(x,y));$
上式中的 $f_i(x,y)$ 为x，y满足的任意实值函数（条件）；

最大熵模型的思想就是：

对于训练集D，其输出Y的条件概率分布熵值最大时，认为是最优的解，最大熵的学习目的就是求解能使条件熵最大的那个模型（也就是Y的条件概率分布）；

最大熵分类模型中存在下列约束优化问题：

$-H(P)=\displaystyle\sum_{(x,y)}\tilde{P}(x)P(y|x)log(P(y|x)),$

$E_P(f_i)=E_{\tilde{P}}(f_i);\displaystyle\sum_yP(y|x)=1;$ （约束条件）

其中 $E_P(f_i)=\displaystyle\sum_{(x,y)}\tilde{P}(x)P(y|x)f(x,y),$ 为特征函数f关于模型P(Y|X)和经验分布 $\tilde{P}(X)$ 的期望；

$E_{\tilde{P}}(f_i)=\displaystyle\sum_{(x,y)}\tilde{P}(x,y)f(x,y)$ ,为特征函数f关于经验分布 $\tilde{P}(x,y)$ 的期望；

因为优化问题为有约束条件的优化问题，所以使用广义拉格朗日乘数法来转化为无条件的最优化问题；
然后将原始问题转化为求解对偶问题（极大极小问题转为极小极大问题），对于凸优化问题来说，二者的解是相同的；
求解出了最大熵模型 $P_w(y|x)$ 之后，代入到对偶函数中，然后采用优化方法（梯度下降、牛顿法、改进的迭代尺度法）来求得w的值，最后反代入最大熵模型，求得最终的模型

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法学习笔记：第六章.逻辑回归与最大熵模型

第六章逻辑回归与最大熵模型逻辑回归和最大熵模型都是对数线性模型；模型的学习就是在给定的训练数据集下对模型（这里是条件概率分布\color{red}{条件概率分布}条件概率分布）进行极大似然估计\color{red}{极大似然估计}极大似然估计；逻辑回归模型：P(Y=k∣x)=ewk⋅x1+∑k=1K−1ewk⋅x,k=1,2,3,...,K−1;P(Y=k|x)=\frac{e^{w_k...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。