面试准备------LR模型

本文深入探讨Logistic Regression(LR),解释它为何被视为线性模型,使用Sigmod函数的原因,以及为什么选择对数损失函数。此外,讨论正则化如何缓解过拟合,LR处理多分类问题的策略,以及离散特征对LR模型的影响。
摘要由CSDN通过智能技术生成

logistics regression

首先明确参数模型和非参数模型的概念: 在参数模型中 通常假设总体服从某一分布,这些分布由某些参数所决定 (例如正态分布由均值和方差所决定),在此基础上构建的模型 称为参数模型
Logistics Regression 便是一个参数模型,假设总体服从伯努利分布,通过极大似然的方法 利用梯度下降求得参数,得到的二值分类模型。
对于线性回归模型 我们通过<w,x>的内积,并设置阈值作为分类的规则,此时<w,b>内积结果是实数域上的,Logistics regression 在此基础上引入了Sigmod函数 将实数域结果压缩到[0,1]范围 。
LR目标函数 :h(x) =g(wTx)
其中g(z) 为sigmod函数 等于 1/(1+e-z)
因此:
logistics regression的表达形式为 P(y=1|w,x)=1/(1+e-wx)

我们希望随机数据点被正确分类的概率最大,对于任意的xi,yi P(yi=1|w,xi)= 1/(1+e-wxi) 我们使用字母p来表示 那么等于0的概率为1-p ,综合起来即为
在这里插入图片描述
因为我们想要所有的数据点每一个的正确分类概率都尽可能大 因此可以将这些概率全部相乘
在这里插入图片描述
通过取对数进一步化简 可以得到logistics regression的目标函数
L(w)=∑i yilog p+(1-yi)(log (1-p))
此时这个式子中唯一的变量就是w,我们通过寻找w使得L(w)取到最大值
这时需要做的就是求L对于w的导数
(注:一定要记住sigmod函数求导的特性 p对于w的导数等于 p(1-p)x (1-p)对于w的导数等于)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值