logistic回归问题自我答疑

最新推荐文章于 2022-11-16 23:22:07 发布

strwolf

最新推荐文章于 2022-11-16 23:22:07 发布

阅读量1.2k

点赞数

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/strwolf/article/details/51329377

版权

本文作者分享了在学习logistic回归时遇到的问题及其答案，包括woe的定义变化对模型的影响，sigmoid函数形式的选择，训练数据标记错误对结果的反向影响，h(θ)的概率解释，以及极大似然函数与损失函数的关系探讨。

摘要由CSDN通过智能技术生成

之前在学习logistic回归的时候遇到几个问题，一直困扰着我，随着学习的深入，我终于想通了这些问题，而且我发现这些看似很难的算法，其实不难，是可以战胜的，所以不要浅尝辄止，要百折不挠，现在把几个问题和答案小结如下：

Q1：woe本来是ln((Bi/BT)/(Gi/GT))，如果定义成ln((Gi/GT)/(Bi/BT))对于最后训练出来的模型(参数)会有什么影响？

A1：由于ln(A/B) = - ln(B/A)，所以就是等价于训练数据X取负号，结果是参数除了常数项全部取反，这个很明显，因为拟合的目标是固定的，极大似然函数最大，所以参数自然会如此变化，也可以把负号拿出去-θ看成α然后就是拟合α，当然就是-θ = α

Q2：通常来说h(θ) = 1/(1+e^-z)，如果令h(θ) = 1/(1+e^z)，对最后训练出来的模型会有什么影响？

A2：全部θ取反，原理也同Q1，就是负号可以拿进去，所以说其实我们实现logistic的时候h(θ)可以用两者中的任意一种，但是我发现一般的现成算法，包，模块都是令成的h(θ) = 1/(1+e^z)，和教科书上的形式有一定的出入，同事告诉我，之所以要写成h(θ) = 1/(1+e^-z)这种形式是因为涉及到什么信息熵的原因，难道不是因为这样函数单增？有朋友会问，如果直接用包、用现成算法，一般跑出来就一堆系数还有一些评价指标，怎么确定他令的哪个h(θ)？一般来说都是前者，如果不放心ÿ

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
logistic回归问题自我答疑

之前在学习logistic回归的时候遇到几个问题，一直困扰着我，随着学习的深入，我终于想通了这些问题，而且我发现这些看似很难的算法，其实不难，是可以战胜的，所以不要浅尝辄止，要百折不挠，现在把几个问题和答案小结如下：Q1：woe本来是ln((Bi/BT)/(Gi/GT))，如果定义成ln((Gi/GT)/(Bi/BT))对于最后训练出来的模型(参数)会有什么影响？A1：由于ln(A/B)
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。