逻辑回归的常见问题

最新推荐文章于 2023-08-27 11:40:21 发布

VIP文章 zlinzju

最新推荐文章于 2023-08-27 11:40:21 发布

阅读量2.7k

点赞数 5

分类专栏：机器学习文章标签：逻辑回归机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43026262/article/details/105620334

版权

文章目录

逻辑回归概括

逻辑回归假设数据服从伯努利分布，采用极大似然估计的思想，运用梯度下降法来求解参数，达到将数据二分类的目的。

逻辑回归的基本假设

逻辑回归的第一个基本假设是假设数据服从伯努利分布（0-1分布）
逻辑回归的第二个假设是假设样本为正的概率（假设函数） $h(x) = sigmoid(w^TX)$

逻辑回归的损失函数

我们采用似然函数作为模型更新的loss，最大化似然函数

在这里插入图片描述
这个损失函数很难求导，于是我们将其取log，变成对数似然函数并转化为

交叉熵损失函数的原理

单个样本的交叉熵损失函数：

$\log \hat{y}+(1-y) \log (1-\hat{y})]$

为什么它能表征真实样本标签和预测概率之间的差值？也就是交叉熵损失函数的数学原理。

因为Sigmoid 函数的输出表征了当前样本标签为 1 的概率，因此也可以表示成： $\hat{y}=P(y=1|x)$ ，

对应的，当前样本标签为 0 的概率就可以表达成： $1−\hat{y}=P(y=0|x)$

把上面两种情况整合到一起：
$P(y|x)=P(y=1|x)^{y} *P(y=0|x)^{(1−y)}$

即：

$x)=\hat{y}^{y} \cdot(1-\hat{y})^{1-y}$

我们希望的是概率 P(y|x) 越大越好。极大似然估计，是在给定当前样本结果的情况下，反推最有可能导致这样结果的参数值，要求的是似然函数最大，或者说损失函数最小时，对应的参数。

首先，我们对 P(y|x) 引入 log 函数，因为 log 运算并不会影响函数本身的单调性。则有：

$\log P(y | x)=\log \left(\hat{y}^{y} \cdot(1-\hat{y})^{1-y}\right)=y \log \hat{y}+(1-y) \log (1-\hat{y})$

最低0.47元/天解锁文章

关注

5
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
逻辑回归的常见问题

文章目录1. logistic回归和线性回归的关系2. 交叉熵损失函数的原理3. 交叉熵损失函数的直观理解4. 分界线是什么5. 逻辑回归也可以处理多分类1. logistic回归和线性回归的关系线性回归模型：写成向量形式为： “广义线性回归”模型为：上诉线性回归模型只能够进行回归学习，但是若要是做分类任务，就需要将分类任务的真实标记yyy与线性回归模型的预测...
复制链接

扫一扫

专栏目录

zlinzju CSDN认证博客专家 CSDN认证企业博客

码龄6年

81: 原创

5万+: 周排名

84万+: 总排名

21万+: 访问

: 等级

2395: 积分

87: 粉丝

292: 获赞

43: 评论

1335: 收藏

私信

关注

热门文章

分类专栏

最新评论

理解3D卷积
30天精通C语言: 最后一句话有带你问题啊，属于自相矛盾了
理解3D卷积
溯水襄陵_: 通道卷积不同的通道上的卷积核的参数是不同的，而3D卷积则由于卷积核本身是3D的，所以这个由于“深度”造成的看似不同通道上用的就是同一个卷积，权重共享。多了一个深度通道，这个深度可能是视频上的连续帧，也可能是立体图像中的不同切片。来自:https://zhuanlan.zhihu.com/p/55567098 我想，博主说的是这个意思
迁移学习中的特征提取
m0_56108481: 你有了吗
迁移学习中的特征提取
m0_56108481: 您好～！能求一份源代码吗？有
理解3D卷积
careless_lu: 同意

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。