(二)逻辑回归算法梳理

1、逻辑回归与线性回归的联系与区别
联系:逻辑回归是线性回归中广义线性模型的应用以进行分类任务。找了一个单调可微函数将分类任务的真实标记与线性回归模型的预测值联系起来。
区别:

  • 线性回归是线性模型进行回归学习,逻辑回归是分类学习(二分类)。
  • 模型不同:
    线性回归模型:
    h θ ( X ) = θ T X h_\theta(X) = \theta^TX hθ(X)=θTX
    逻辑回归模型:
    h θ ( X ) = 1 1 + e − θ T X h_\theta(X) = \frac{1}{1+e^{-\theta^TX}} hθ(X)=1+eθTX1

2、逻辑回归的原理
利用线性回归解决分类问题并不适用。如,二分类,我们需要使得假设的值总是在0到1之间,线性回归无法做到,那么就想到找一个模型的输出是0/1,理想的是单位阶跃函数,而单位阶跃函数不连续(横坐标为0时),无法应用,则找寻了一个单调可微替代函数—对数几率函数来作模型(见1)。

3、逻辑回归损失函数推导及优化

P ( y = 1 ∣ X ; θ ) = h θ ( X ) − − 假 设 在 估 计 y = 1 的 概 率 P(y=1|X;\theta) = h_\theta(X)--假设在估计y=1的概率 P(y=1X;θ)=hθ(X)y=1

则 P ( y = 0 ∣ X ; θ ) = 1 − h θ ( X ) 则P(y=0|X;\theta) = 1 - h_\theta(X) P(y=0X;θ)=1hθ(X)

则 P ( y ∣ X ; θ ) = [ h θ ( X ) ] y [ 1 − h θ ( X ) ] 1 − y 则P(y|X;\theta) = [h_\theta(X)]^y[1-h_\theta(X)]^{1-y} P(yX;θ)=[hθ(X)]y[1hθ(X)]1y

对此进行参数拟合

L ( θ ) = P ( y ⃗ ∣ X ; θ ) L(\theta) = P(\vec{y}|X;\theta) L(θ)=P(y X;θ)

= ∏ j m P ( y ∣ X ; θ ) =\prod_{j}^mP(y|X;\theta) =jmP(yX;θ)

= ∏ j m [ h θ ( X ) ] y [ 1 − h θ ( X ) ] 1 − y =\prod_{j}^m[h_\theta(X)]^y[1-h_\theta(X)]^{1-y} =jm[hθ(X)]y[1hθ(X)]1y

to find θ \theta θ to maximize L ( θ ) L(\theta) L(θ),则

l ( θ ) = l o g L ( θ ) l(\theta) = logL(\theta) l(θ)=logL(θ)

= ∑ j = 1 m y j [ h θ ( X ) ] + ( 1 − y j ) ( [ 1 − h θ ( X ) ] ) =\sum_{j=1}^m{y^j[h_\theta(X)]+(1-y^j)([1-h_\theta(X)])} =j=1myj[hθ(X)]+(1yj)([1hθ(X)])

损失函数:对数损失函数—参数模型的对数似然函数最大化对应损失函数极小化

J ( θ ) = − 1 m l ( θ ) J(\theta) = -\frac{1}{m}l(\theta) J(θ)=m1l(θ)

= − 1 m ∑ j = 1 m y j [ h θ ( X ) ] + ( 1 − y j ) ( [ 1 − h θ ( X ) ] ) = -\frac{1}{m}\sum_{j=1}^m{y^j[h_\theta(X)]+(1-y^j)([1-h_\theta(X)])} =m1j=1myj[hθ(X)]+(1yj)([1hθ(X)])

4、正则化与模型评估指标
损失函数后添加的额外项,两种:L1-norm 及L2-norm两种(L1正则化和L2正则化 或 L1范数和L2范数)

可看作是损失函数的惩罚项--------用于对损失函数中某些参数做出一些限制

θ \theta θ:是回归中表示特征的参数

L1正则化是指权值向量 θ \theta θ中各个元素的绝对值之和,通常表示为||w||1------产生稀疏权值矩阵,用于特征选择(一定程度上也可防止过拟合)

L2正则化是指权值向量 θ \theta θ中各个元素的平方和然后再求平方根,通常表示为||w||2-----防止模型过拟合

5、逻辑回归的优缺点
优点:
直接对分类可能性进行建模,无需事先假设数据分布,避免了假设分布不准带来的问题。
不是仅预测出“类别”,而是可得到近似概率预测—对需要利用概率作辅助决策的任务很有用
模型所用对数几率函数是任意阶可导凸函数,可直接用于求取最优解
缺点:
只适用于二分类,无法解决多分类问题(softmax回归)

6、样本不均衡问题解决办法

  • 再缩放:即调整预测值,将原先几率比值 y 1 − y \frac{y}{1-y} 1yy乘上观测几率 m + m − \frac{m^+}{m^-} mm+作新的决策规则,其中y是预测出的y值,y是反应将x视为正例的可能性,1-y是反例可能性,m+指的是训练集中正例数目,m-是训练集中反例数目。
  • 欠采样
  • 过采样
  • 阈值移动

7、sklearn参数
scikit-learn中三个与逻辑回归相关的库:
LogisticRegression、LogisticRegressionCV、logistic_regression_path
solver参数----逻辑回归中损失函数优化:
liblinear:使用坐标轴下降法来迭代优化损失函数
lbfgs:利用损失函数Hessian矩阵来迭代优化损失函数
newton-cg:利用损失函数Hessian矩阵来迭代优化损失函数
sag:随机平均梯度下降,每次迭代仅使用部门样本来计算梯度,适用于样本较多时候

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值