Task3:逻辑回归

逻辑回归

1.逻辑回归与线性回归的联系与区别
2.逻辑回归的原理
3.逻辑回归损失函数推导及优化
4.正则化与模型评估指标
5.逻辑回归的优缺点
6.样本不均匀问题解决办法
7.Sklean参数
8.代码实现

1.逻辑回归与线性回归的联系与区别

线性回归解决的是连续变量的问题,但离散性变量,在分类任务中使用线性回归,效果不理想。`
例子:
线性拟合分类变量
图显示了是否购买玩具和年龄之间的关系,可以用线性回归拟合成一条直线,将购买标注为1,不购买标注为0,拟合后取当0.5值为阈值来划分类别。

y ^ = { 1 , f ( x ) > 0.5 , 0 , f ( x ) < 0.5 \hat y =\begin{cases} 1, f(x)>0.5, \\\\0, f(x)<0.5\end{cases} y^=1,f(x)>0.5,0,f(x)<0.5
可以看到,在途中,年龄的区分点约为19岁。
但当数据点不平衡时,很容易影响到阈值,见以下图:
非平衡数据拟合
可以看到,0值样本的年龄段往高年龄端偏移后,真实的阈值依然是19岁左右,但拟合出来的曲线的阈值往后边偏移了。可以想想,负样本越多,年龄大的人越多,偏移越严重。
实际情况是60岁的老人和80岁的老人都不会购买玩具,增加几位80岁的老人,并不会影响20岁以下人群购买玩具的概率。但因为拟合曲线原本的值域为(−∞ ∞)而转换后的值域为[0,1],阈值对变量偏移很敏感。

2.逻辑回归的原理

因此理想的替代函数应当预测分类为0或1的概率,当为1的概率大于0.5时,判断为1,当为1的概率小于0.5时,判断为0。因概率的值域为[0,1],这样的设定比线性回归合理很多。
常用的替代函数为Sigmoid函数,即:

h ( z ) = 1 1 + e − z h(z)=\frac{1}{1+e^{-z}} h(z)=1+ez1
其中, z = θ T x z=\theta^Tx z=θTx
我们可以看到,当z大于0时,函数大于0.5;当函数等于0时,函数等于0.5;函数小于0时,函数小于0.5。如果用函数表示目标分到某一类的概率,我们可以采用以下“单位阶跃函数”来判断数据的类别:
h ( z ) = { 0 , z < 0 0.5 , z = 0 0 , z > 0 h(z)=\begin{cases} 0, &&z<0 \\0.5,&&z=0\\0, &&z>0\end{cases} h(z)=0,0.5,0,z<0z=0z>0
若Z大于0,则判断为正例;若小于0,判断为反例;若等于0,可任意判别。由于Sigmoid函数单调且可导,函数在(0,1)之间程Z字型,可以很好的模拟二分类情况,因此很适合我们要解决的问题。
接下来我们来推导逻辑回归函数的优化

3.逻辑回归损失函数推导及优化

p ( y = 1 ∣ x ; θ ) = h θ ( x ) p ( y = 0 ∣ x ; θ ) = 1 − h θ ( x ) p(y=1|x;\theta)=h_\theta(x)\\\\p(y=0|x;\theta)=1-h_\theta(x) p(y=1x;θ)=hθ(x)p(y=0x;θ)=1hθ(x)
可以写作一般公式,
P ( y ∣ x ; θ ) = h ( x ) y ( 1 − h ( x ) ) ( 1 − y ) P(y|x;\theta)= h(x)^y (1-h(x))^{(1-y)} P(yx;θ)=h(x)y(1h(x))(1y)

极大似然函数为,
L ( θ ) = ∏ i = 1 m h θ ( x ( i ) ) y ( i ) ( 1 − h θ ( x ( i ) ) ( 1 − y ( i ) ) , L(\theta) = \prod^{m}_{i=1}h_\theta (x^{(i)})^{y^{(i)}} (1-h_\theta (x^{(i)})^{(1-y^{(i)})}, L(θ)=i=1mhθ(x(i))y(i)(1hθ(x(i))(1y(i)),
对数极大似然函数为,
l ( θ ) = l o g L ( θ ) = ∑ i = 1 m y ( i ) l o g h θ ( x ( i ) ) + ( 1 − y ( i ) ) l o g ( 1 − h θ ( x ( i ) ) ) , l(\theta) = log L(\theta) = \sum^{m}_{i=1} y^{(i)}log h_\theta (x^{(i)}) + (1-y^{(i)})log (1-h_\theta (x^{(i)})), l(θ)=logL(θ)=i=1my(i)loghθ(x(i))+(1y(i))log(1hθ(x(i))),
损失函数为,
J ( θ ) = −

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值