机器学习_4:logistic回归

实验背景

相比k近邻算法和决策树算法,logistic回归算法算是真正意义上的机器学习基础算法,哪怕是现在的深度学习,一样有用到logistic回归算法的内容。而logistic回归算法很大程度上和线性回归以及对数线性回归有关,本次实验就来介绍logistic回归算法的原理和作为分类算法的效果。

1.logistic回归算法原理

1.1.线性回归

假设有这么一堆数据集
在这里插入图片描述
我们的目标就是找到
在这里插入图片描述
比如我们要找到房子价格的线性回归函数,在考虑该函数只与房子面积相关的情况下有
在这里插入图片描述
核心目标就是找到这个w和b,使得估计的f(x)符合对应的y。对于我们来说,这个f(x)和y的差距越小越好,所以我们使用最小二乘法来进行判断
在这里插入图片描述
高中的时候我们已经学习过最小二乘法的计算公式,这里我们列出完整的解决过程,已解决求多个w的问题,我们对w和b求偏导,并令他们等于0,可得到公式
在这里插入图片描述
在这里插入图片描述
这就是只有一个w的情况下,w和b的解。那么w代表什么呢?w会影响到线性回归函数的斜率,也就是说w可以理解为实例的属性,而多个w就可以理解为实例的各个属性,这些属性共同影响实例的值
。同理,对于多个w,我们可以分别对他们进行偏导并令其等于0,解开这个多元一次方程组就可以找到我们想要的线性回归方程。
在这里插入图片描述
该图就是两个w的情况下,回归函数与x的关系。

1.2.对数线性回归

虽然线性回归方程看起来很美好,但实际上,生活中很少有单纯用线性回归函数就能描述的现象。这时候我们就需要用到对数线性回归函数,使得我们在保留线性回归函数特性的同时更好的预测非线性复杂函数。
线性回归模型:
在这里插入图片描述
可推广至:
在这里插入图片描述
实际上这个函数可以不停地进行嵌套得到一个复杂的套娃函数。我们举个简单的例子
在这里插入图片描述
在这里插入图片描述
这就是最基础的对数线性回归,logistic就是基于这种回归来改进与完善的。

1.3.logistic回归

logistic回归一般用来解决分类问题,尽管其对解决的问题规模并没有限制,但一般来说,最适合他解决的问题是二分类问题。对于线性函数来说,二分类问题最好分成y=0与y=1的阶跃函数。
在这里插入图片描述
那么问题显而易见,这是不连续且不可微的。当预测目标处于范围边界的情况下,我们该如何进行判断他到底属于哪一类呢?
logistic函数(sigmoid)函数就是解决这个问题的
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值