【机器学习系列之二】逻辑回归(LR,Logistic Regression)

起源模型原理 2.1 问题转换 2.2 损失函数-真实值与计算值的关系 2.3 参数求解方法-梯度下降法模型优化 3.1 过拟合于欠拟合 3.2 正则化实践应用案例 4.1 微额借款用户人品预测大赛 4.2 使用sklearn包来实现总结引用 1.起源逻辑回归的起源分了好几个阶段,每个阶段都是前人经过漫长的研究,试验得来的,了解它是怎么来的,有助于理解如何把一个现实问题转
摘要由CSDN通过智能技术生成
  1. 起源
  2. 模型原理
    2.1 问题转换
    2.2 损失函数-真实值与计算值的关系
    2.3 参数求解方法-梯度下降法
  3. 模型优化
    3.1 过拟合于欠拟合
    3.2 正则化
  4. 实践应用案例
    4.1 微额借款用户人品预测大赛
    4.2 使用sklearn包来实现
  5. 总结
  6. 引用

1.起源

逻辑回归的起源分了好几个阶段,每个阶段都是前人经过漫长的研究,试验得来的,了解它是怎么来的,有助于理解如何把一个现实问题转化问数学问题,这是一个非常重要的数学思想。
Logistic 起源于对人口增长的研究,Adolphe Quetelet发表了一篇关于人口增长的文章,文章认为人口不可能一直呈几何指数增长,人口的增长会被人口增长速度的平方呈比例的一种阻力的影响,但没有提供相应的数学推导依据,所以没被人采用。在1838年Verhulst发表了关于人口数量增长的论文,就是在这篇论文里面他推导出了logistic equation,论文中提到了一个非常重要的观点,随着时间的增加,一个国家的资源,例如生存空间,食物,和这个国家的生育能力会限制一个国家的人口,以至于最终这个国家的人口会趋于一个比较稳定的值。更重要的是,他还把这个过程用数学公式描述了出来。他把人口的增长速度公式入手,即人口数量P(t)对时间t的导数:

Pt=rP(1PK)

其中K 就是他认为的人口增长到一定阶段的稳定值,r是增长率。当P远小于K时,P/K就会趋于零,也就是现阶段的人口远远小于稳定值时,这时就变为 PtrP .对这个式子求一阶导,就变成了: P(t)P(0)ert 。当p(t)接近K时,增长的速度就会变慢,通过这条式子逆向推导,整合可以得到:
P(t)=P(0)ert1+P(0)(ert1)/K

这样可以得到最初的式子,当拿这条式子和当时英国,法国的人口增长比较时,发现确实可以拟合得很好。 这里写图片描述
小结:至此,逻辑回归的第一版就出现了,从中可以看到,如果要实现一个算法,要让人信服,让计算机能够运行,必须把现实问题转换为数学问题,通过数学运算才能得到一个比较好的解释,所以把现实问题转换为数学问题是一个非常重要的能力,在接下来的文章中也有非常好的体现。

2 模型原理
2.1 问题转换

假如我们要预测一个地区的房价,由线性回归知道,只需要根据给定的数据集,绘制一条曲线,或者直线,求出最优的参数,然后用这组最优参数作为权重组合特征,当新的数据集来的时候,预测出相应的y值就OK了。

但若是想要预测一个地区的天气是下雨天,还是不下雨呢?
这显然是一个分类问题,那怎么把线性回归的问题,转变为分类的问题呢?
我们的想法是:能否找到一个函数,他可以把我们的y值转换到另外一个空间中,在这个空间中,两个类别会根据其特性密集的分布在两个不同区域中,然后画一条线把他们切分开来,这条直线称为决策边界。如下图所示:
这里写图片描述

现在就要用到先前说的人口数据那条线了,经过演化,最终上面那条公式演化成如下表示,大家给他取名为sigmoid函数:

f(X)=11+eθTX=11+ey
它的图像是: 这里写图片描述
其中 θ 为参数向量,X为特征向量。先来看 y=θTX 。这里的y其实就是先前线性回归得出的预测值,这一步只是通过这个函数,把这些数值映射到[0,1]之间的数值。
假设我们要预测今天会不会下雨,我们可以知道今天的温度,湿度,空气质量,风力是多少,是否有台风等特征表示的数据,用
  • 4
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值