从概率的角度看logistic regression

最新推荐文章于 2022-03-06 19:59:03 发布

notHeadache

最新推荐文章于 2022-03-06 19:59:03 发布

阅读量877

点赞数 1

分类专栏：机器学习算法文章标签： Logistic regression 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/notHeadache/article/details/84434114

版权

机器学习算法专栏收录该内容

7 篇文章 0 订阅

订阅专栏

logistic regression假设样本 $x$ 为正的概率是： $P(Y=1|x)=\frac{1}{1+e^{-(w\cdot x+b)}}$
我们在看这个公式的时候，可以理解成

$x$ 是一个事件，一共有1,2,…,N个事件
$Y$ 是类别，有0和1，这两种类别

那么 $P (Y = 1 ∣ x)$ 我理解就是一个后验概率，后验概率的意思是

后验概率：事情已经发生，要求这件事情发生的原因是由某个因素引起的可能性的大小

所以 $P (Y = 1 ∣ x)$ 就是事件 $x$ 已经发生了， $x$ 属于这个 $Y = 1$ 这个类别的概率是多少。

现在就假设 $P(Y=1|x)=\frac{1}{1+e^{-(w\cdot x+b)}}$ ，同理 $P(Y=0|x)=1-\frac{1}{1+e^{-(w\cdot x+b)}}$ 也可以是这么理解。

OK，我们假设是这个概率，那么假设中的参数 $w ， b$ 怎么求呢？答案是：

极大似然函数估计法

为什么用这个方法求 $w ， b$ ？因为

极大似然函数估计法就是用来求模型已知，参数未知的情况下，通过若干次试验，观察其结果，利用试验结果得到某个参数值能够使样本出现的概率为最大。

在logistic regression里，模型已知了啊，是 $P(Y=1|x)=\frac{1}{1+e^{-(w\cdot x+b)}}$ ，和 $P(Y=0|x)=1-\frac{1}{1+e^{-(w\cdot x+b)}}$ ，参数 $w ， b$ 未知，用试验结果，就是训练数据 $x_{i},y_{i}$ ， $i = 1, 2, . . ., N$ 去估计参数啊。

所以用极大化似然函数的方法，可以列出似然函数 $L(w|x)=P(x|w)=\prod_{i=1}^{N}p(x_{i}|w)=\prod_{i=1}^{N}P(Y=1|x)^{y_{i}}P(Y=0|x)^{1-y_{i}}$

这里解释一下这个似然函数 $L (w ∣ x)$ ，意思是事件 $x$ 已经发生了， $w$ 的值等于某个值时使得事件 $x$ 发生的可能性等于多少。那么 $p (x ∣ w)$ 的意思是，在给定w的值等于多少，事件 $x$ 发生的概率是想到的。所以就可以列出上面的似然函数。

我们要求 $x$ 发生的可能性最大啊，那么就是极大化似然函数，求出来的 $w$ 就是我们想要的参数了。由于该极大似然函数无法直接求解，我们一般通过对该函数进行梯度下降来不断逼急最优解。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
从概率的角度看logistic regression

logistic regression假设样本xxx为正的概率是：P(Y=1∣x)=11+e−(w⋅x+b)P(Y=1|x)=\frac{1}{1+e^{-(w\cdot x+b)}}P(Y=1∣x)=1+e−(w⋅x+b)1我们在看这个公式的时候，可以理解成xxx是一个事件，一共有1,2,…,N个事件YYY是类别，有0和1，这两种类别那么P(Y=1∣x)P(Y=1|x)P(Y=1∣...
复制链接

扫一扫

专栏目录

notHeadache CSDN认证博客专家 CSDN认证企业博客

码龄8年

45: 原创

7万+: 周排名

49万+: 总排名

15万+: 访问

: 等级

1944: 积分

46: 粉丝

191: 获赞

98: 评论

367: 收藏

私信

关注

热门文章

分类专栏

最新评论

OkHttp调用HTTPS遇到的问题之：SocketException: Software caused connection abort: recv failed
yuan_liping: 正好遇到使用okhttp报错
LeetCode上的Arry(数组)类型的题目
CSDN-Ada助手: 实现一个最小生成树算法，支持 Prim 和 Kruskal 算法。
[编程题] LeetCode上的Tree类型的题目
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
正则化贪心森林RGF(Regularized Greedy Forest)详解和实战
断念133: 作者您好，您的文章我阅读后，正则化贪心森林RGF很有兴趣研究一下，文中您提到了《Predicting Disk Replacement towards Reliable Data Centers》的复现，请问可以借鉴一下您的代码吗？非常感谢您，我的邮箱是2972162848@qq.com
LeetCode上的backTracking类型的题目
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加条理清晰的目录。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。