LR与Sigmod函数

最新推荐文章于 2023-05-23 11:25:46 发布

ChanKamShing

最新推荐文章于 2023-05-23 11:25:46 发布

阅读量252

点赞数

分类专栏：大数据数据结构与算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39400271/article/details/101119158

版权

大数据同时被 2 个专栏收录

48 篇文章 0 订阅

订阅专栏

数据结构与算法

15 篇文章 2 订阅

订阅专栏

在使用LR时，经常用Sigmod函数来表示一个概率，为什么LR可以使用Sigmod函数呢？

首先，LR的假设只有一个，就是两个类别的特征服从均值不等、方差相等的高斯分布。为什么假设它服从高斯分布？一方面，高斯分布容易理解；另一方面，从信息论的角度看，当均值和方差已知时，高斯分布是熵最大的分布。当熵分布最大时，可以平摊风险。就如二分查找法，每次都将中间作为查找点，目的就是为了平摊风险。

自定义“风险”：

$R(y=0|x) = \lambda _{00}P(y=0|x) + \lambda _{01}P(y=1|x)$

$R(y=1|x) = \lambda _{10}P(y=0|x) + \lambda _{11}P(y=1|x)$

式中， R(y=0|x) 表示样本预测为0的风险， R(y=1|x) 表示样本预测为1的风险， $\lambda _{ij}$ 表示预测为，实际为所带来的风险。

在LR算法中，它认为，预测正确不会带来风险，即 $\lambda _{00}$ 和 $\lambda _{11}$ 都为0，另外，认为标签为0，而预测为1和认为标签为1，而预测为0，两者所带来的风险是一样的，所以 $\lambda _{01}$ 和 $\lambda _{10}$ 统一用 $\lambda$ 来表示。

上面的“风险”化简为：

$R(y=0|x) = \lambda P(y=1|x)$

$R(y=1|x) = \lambda P(y=0|x)$

对于某一个样本，应该根据风险最小化来预测其类别，即比较两个条件概率，并把样本分配到概率最大的那个类中。

如： $\frac{P(y=1|x)}{P(y=0|x)}$

将上式取对数，再利用朴素贝叶斯公式展开，得到：

$lg{\frac{P(y=1|x)*P(x)}{P(y=0|x)*P(x)}}$

$= lg(\frac{P(x,y=1)}{P(x,y=0)})$

$= lg {\frac{P(x|y=1)P(y=1)}{P(x|y=0)P(y=0)}}$

$=lg{\frac{P(x|y=1)}{P(x|y=0)}} + lg {\frac{P(y=1)}{P(y=0)}}$

由于 P(y=1) 和 P(y=0) 是常数，可以用常数 C_1 代替，套入高斯公式，

$lg{\frac{P(x|y=1)}{P(x|y=0)}} + lg {\frac{P(y=1)}{P(y=0)}}$

$= - \frac{(x-\mu _1)^2}{2\sigma ^2} + \frac{(x-\mu _0)^2}{2\sigma ^2} + C_1 = \frac{\mu _1 - \mu _2}{\sigma ^2}x + C_2 = wx$

又 P(y=1|x)+P(y=0|x)=1 ，两边取指数，得到：

$P(y=1|x) = \frac{1}{1+exp(-wx)}$

综上，LR算法可以使用Sigmod函数来进行计算分析。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
LR与Sigmod函数

在使用LR时，经常用Sigmod函数来表示一个概率，为什么LR可以使用Sigmod函数呢？首先，LR的假设只有一个，就是两个类别的特征服从均值不等、方差相等的高斯分布。为什么假设它服从高斯分布？一方面，高斯分布容易理解；另一方面，从信息论的角度看，当均值和方差已知时，高斯分布是熵最大的分布。当熵分布最大时，可以平摊风险。就如二分查找法，每次都将中间作为查找点，目...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。