机器学习算法--线性回归算法

最新推荐文章于 2024-10-11 12:01:25 发布

2301_79295435

最新推荐文章于 2024-10-11 12:01:25 发布

阅读量530

点赞数 25

文章标签：算法机器学习线性回归

本文链接：https://blog.csdn.net/2301_79295435/article/details/140203365

版权

一、如何理解线性回归算法

在日常的生活中，我们经常会遇到一些排队的场景，例如：早上在上班早高峰去坐地铁，在地铁入口处地铁协管员会要求人们进行排队，尽管队伍中的人员没有刻意站成一条直线，但从队伍外边来看，它就是一条直线。

有一天，因为你起床晚了，特别着急的赶到地铁站，如果赶不上这班地铁你就要迟到了，所以你很想一下子排到队伍的前边去，但是按照要求，你只能排在队伍的最后边。同样，新来的人要进地铁站，也一定排在队伍的最后边。

这个操作看似很平常，只要你按照刚才说的排好队，就说明你已经成功在你的潜意识中构建了一个模型，根据模型去寻找你自己的站位。这个模型就是线性回归模型，你的站位就是这个模型的解，是一个具体的数值。在这个模型中，所有人的站位都分布在一条直线的周围，后来的人也都会站在这条直线的周围，让它依然是一条直线，这就是线性回归模型背后的逻辑思路。

二、线性回归算法核心原理

线性回归算法的逻辑思路：根据已有的数据去寻找一条直线，让它尽可能的去接近这些数据，再用这条直线去预测新数据可能的结果，这个预测结果就是一个具体的数值。

那我们怎么去找到这条直线呢？

关于直线的方程大家都知道吧？在平面内表示一条直线的方程为：Y=AX+B，A表示斜率，B表示截距，直线图如下图所示：

在这个式子中，我们用一组合适的参数A和B去描述一组对应的事物X和Y之间的关系，然后再用得到的方程来预测未知事物的可能性，这就是线性回归用来做预测的套路。

回到刚才排队的例子中，如果我们把队伍中每个人的顺序和这个人的位置想象成X和Y，我们根据目前排队的人员顺序和位置信息一定能找到一组A和B，用来描述人员排队的这一条直线，让尽可能多的人都站在这条直线上，或者离这条直线的距离最近，这时我们已经找到了表示人员排队的这条直线了。

最后我们再用这个已知的分布，也就是确定了A和B的直线方程Y=AX+B，将新来的人的顺序信息带入该方程中，就可以得到新来的人的位置信息了。

以上就是一个一元线性方程的例子，因为影响结果Y的只有一个因素X。对于在实际问题，影响一个事情的因素可能有多个，我们就需要构建一个多元回归方程了，它不再是一条直线，可能是一个多维平台了。比如，在预测银行贷款的例子中，贷款人的工资和年龄会影响贷款的额度，这个时候我们就要构建一个二元回归方程了，它是一个复杂的平面，公式为如下：