0 写在前面
机器学习强基计划聚焦深度和广度,加深对机器学习模型的理解与应用。“深”在详细推导算法模型背后的数学原理;“广”在分析多个机器学习模型:决策树、支持向量机、贝叶斯与马尔科夫决策、强化学习等。
1 什么是线性回归?
线性回归是机器学习线性模型中的一种,也是数理统计的一种分析技术,采用最小化拟合误差的思想(例如最小二乘法)来对变量间的关系建模。可以用之前提过的例子说明
在经济学中,个人的收入与消费之间存在着密切的关系。收入越多,消费水平也越高;收入较少,消费水平也较低。从一个社会整体来看,个人的平均收入x与平均消费y之间大致呈线性关系。现在我们看看路人甲的收入和消费水平的关系
收入x 消费水平y 1.0 0.5 1.2 0.8 1.5 1.3 现在的问题是:请问在一个社会中,路人甲收入水平为2.0时,消费水平如何?
把路人甲的数据放在坐标系里可视化一下,然后用一条直线去拟合这个点集,使所有点到这条直线的距离最小——拟合误差最小。