逻辑回归为什么要用sigmoid函数

本文从普通线性模型与广义线性模型的角度出发,探讨逻辑回归的起源。通过广义线性模型的指数簇分布和伯努利分布的推导,揭示了逻辑回归为何使用sigmoid函数作为联系函数,其在二分类问题中的重要性得以显现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这个问题我们要从普通线性模型与广义线性模型开始讲起,看官不要着急,慢慢的往下看。

普通线性模型与广义线性模型

普通线性模型是用模型的预测值去逼近真实标记y:

Y = ω 1 x 1 + ω 2 x 2 + ω 3 x 3 + ω 4 x 4 + . . . + ω p x p + b Y = \omega_{1}x_1 + \omega_{2}x_2 + \omega_{3}x_3 + \omega_{4}x_4 +... + \omega_{p}x_{p}+b Y=ω1x1+ω2x2+ω3x3+ω4x4+...+ωpxp+b

Y = ω T x + b Y = \omega^Tx+b Y=ωTx+b

而如果我们令预测值去逼近y的衍生物,我们就得到了广义线性模型。

g ( Y ) = ω T x + b g\left(Y\right) = \omega^Tx+b g(Y)=ωTx+b

考虑单调可微函数g,有如上广义线性模型,其中函数g称为“联系函数”(link function)。

普通线性模型

普通线性模型 (ordinary linear model) 可以用下式表示:
Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + . . . + β p − 1 x p − 1 + ϵ Y = \beta_{0} + \beta_{1}x_1 + \beta_{2}x_2 + \beta_{3}x_3 + \beta_{4}x_4 +... + \beta_{p-1}x_{p-1}+\epsilon Y=β0+β1x1+β2x2+β3x3+β4x4+...+βp1xp1+ϵ

普通线性模型的假设主要有以下几点:

  1. 响应变量 Y Y Y和误差项 ϵ \epsilon ϵ正态性:响应变量 Y Y Y和误差项 ϵ \epsilon ϵ服从正态分布,且 ϵ \epsilon ϵ是一个白噪声过程,因而具有零均值,同方差的特性
  2. 预测量 x i x_i xi和未知参数 β i \beta_i βi的非随机性:预测量 x i x_i x
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值