面试准备------LR模型

最新推荐文章于 2022-08-26 16:38:00 发布

1只小包子

最新推荐文章于 2022-08-26 16:38:00 发布

阅读量1k

点赞数 1

分类专栏：面试基础算法总结

本文链接：https://blog.csdn.net/a940902940902/article/details/87645160

版权

本文深入探讨Logistic Regression（LR），解释它为何被视为线性模型，使用Sigmod函数的原因，以及为什么选择对数损失函数。此外，讨论正则化如何缓解过拟合，LR处理多分类问题的策略，以及离散特征对LR模型的影响。

摘要由CSDN通过智能技术生成

logistics regression

首先明确参数模型和非参数模型的概念：在参数模型中通常假设总体服从某一分布，这些分布由某些参数所决定（例如正态分布由均值和方差所决定），在此基础上构建的模型称为参数模型
Logistics Regression 便是一个参数模型，假设总体服从伯努利分布，通过极大似然的方法利用梯度下降求得参数，得到的二值分类模型。
对于线性回归模型我们通过<w,x>的内积，并设置阈值作为分类的规则，此时<w,b>内积结果是实数域上的，Logistics regression 在此基础上引入了Sigmod函数将实数域结果压缩到[0,1]范围。
LR目标函数：h(x) =g(w^Tx)
其中g(z) 为sigmod函数等于 1/(1+e^-z)
因此：
logistics regression的表达形式为 P(y=1|w,x)=1/(1+e^-wx)

我们希望随机数据点被正确分类的概率最大,对于任意的x_i,y_i P(y_i=1|w,x_i)= 1/(1+e^-wx_i) 我们使用字母p来表示那么等于0的概率为1-p ，综合起来即为
在这里插入图片描述
因为我们想要所有的数据点每一个的正确分类概率都尽可能大因此可以将这些概率全部相乘

通过取对数进一步化简可以得到logistics regression的目标函数
L(w)=∑_i y_ilog p+(1-y_i)(log (1-p))
此时这个式子中唯一的变量就是w，我们通过寻找w使得L(w)取到最大值
这时需要做的就是求L对于w的导数
（注：一定要记住sigmod函数求导的特性 p对于w的导数等于 p(1-p)x (1-p)对于w的导数等于）