逻辑回归：从极大似然估计角度推导损失函数

忘年。

已于 2024-05-13 10:53:52 修改

阅读量189

点赞数 1

分类专栏：机器学习文章标签：逻辑回归算法机器学习

于 2024-05-09 10:30:27 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73602487/article/details/138603247

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1. 逻辑回归的概率表示（Sigmoid函数）

$y=\frac1{1+e^{-(w^T\cdot x+b)}}$

其中 w 和 b 是我们需要找到的模型参数。

2. 构建似然项

对于二分类问题，我们希望将 P(y|x;w) 表达成一个通用形式，它可以处理 y=1 和 y=0 两种情况。这可以通过将 P(y|x) 写为：

$P(y|x;w)=(P_1(x;w))^y(1-P_1(x;w))^{(1-y)}$

那么第 i 个样本点的似然项为：

$P(y_i|x_i;w)=P_1(x_i;w)^{y_i}(1-P_1)(x_i;w)^{(1-y_i)}$

这个公式表示在参数 w0 和 w1 给定的情况下，观测到数据 yi 的概率。

3. 构建似然函数

通用的表达形式：

$L(w)=\prod_{i=1}^n(P_1(x_i;w))^{y_i}(1-P_1(x_i;w))^{(1-y_i)}$

这里，n 是样本的数量。这个公式表示了在给定的模型参数下，得到观测数据的概率。

（1）两边取对数：

$\ln L(w)=\ln\prod_{i=1}^n(P_1(x_i;w))^{y_i}(1-P_1(x_i;w))^{(1-y_i)}$

（2）将乘积转换为求和：

$\ln L(w)=\sum_{i=1}^n\ln\left((P_1(x_i;w))^{y_i}(1-P_1(x_i;w))^{(1-y_i)}\right)$

（3）将幂运算转换为乘法：

$\ln L(w)=\sum_{i=1}^n\left[y_i\ln(P_1(x_i;w))+(1-y_i)\ln(1-P_1(x_i;w))\right]$

至此，我们从原始的似然函数得到了对数似然函数，这个对数似然函数的形式就是我们常说的交叉熵损失函数（Cross-Entropy Loss Function）。在实际的优化过程中，我们通常需要将问题转化为最小化问题。因此，我们将对数似然函数取负，得到负对数似然函数，即：

$L_{loss}(w)=-\sum_{i=1}^n\left[y_i\ln(P_1(x_i;w))+(1-y_i)\ln(1-P_1(x_i;w))\right]$

我们的目标就是寻找一组参数使得这个负对数似然函数（也就是损失函数）最小。

4. 极大似然估计

极大似然估计（Maximum Likelihood Estimation, MLE）是一种基于概率统计的参数估计方法。它的基本思想是：在已知某个参数能使得数据出现的概率最大的情况下，我们就可以认为这个参数就是最优参数。

换句话说，给定一个模型和一组观测数据，我们可以计算出在不同参数值下得到这组数据的概率。这个概率被称为似然函数。我们的目标就是找到使得这个概率（即似然函数）最大的参数值，这个参数值就是极大似然估计的结果。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
逻辑回归：从极大似然估计角度推导损失函数

从极大似然的角度推导逻辑回归中的交叉熵损失函数
复制链接

扫一扫

专栏目录

忘年。 CSDN认证博客专家 CSDN认证企业博客

码龄2年

3: 原创

187万+: 周排名

14万+: 总排名

1246: 访问

: 等级

92: 积分

26: 粉丝

32: 获赞

0: 评论

18: 收藏

私信

关注

热门文章

分类专栏

云计算与分布式系统 2篇
机器学习 1篇

最新评论

分布式系统：逻辑时钟与向量时钟
CSDN-Ada助手: 非常棒的博客！很高兴看到你深入探讨了分布式系统中的逻辑时钟和向量时钟。通过这篇文章，我对事件之间的因果关系和并行关系有了更清晰的理解。希望你能继续分享关于分布式系统的知识。在扩展阅读方面，你可以了解一下分布式系统中的一致性模型，比如Paxos算法或Raft算法。它们可以帮助你更好地理解分布式系统中的数据一致性和容错性。希望这些建议能对你的学习有所帮助！期待看到更多精彩的博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
分布式系统：Chord 多播树的查找、构建与维护
CSDN-Ada助手: 恭喜您发布了第三篇博客《分布式系统：Chord 多播树的查找、构建与维护》，内容涉及的主题十分有趣且深度，展示了您对分布式系统的深入理解和研究。希望您能继续坚持创作，分享更多有价值的内容。建议您在下一篇博客中可以加入一些案例分析或实践经验，以丰富您的内容，也可以尝试与其他领域进行交叉探讨，拓展您的视野。期待您更多精彩的作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
逻辑回归：从极大似然估计角度推导损失函数
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。