线性回归以及梯度下降
文章目录
一.什么是线性回归
首先应该明确:线性回归是用来解决回归问题的。应用与连续型数据。
比如说:
- 房价的预测:根据现在手头的房价数据,我们大致就可以推出未来房价的大体走势
- 投放广告的数量:一般来说,投放广告的数量和你挣了多少钱,也是有一定的线性关系的
线性回归就是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
根据涉及到的变量的数量,我们大致可以把线性回归算法分为如下两个类别:
- 一元线性回归:涉及到的变量只有一个
- 多元线性回归:涉及到的变量为两个或两个以上
二.线性回归的表示
最简单的线性回归就是二维平面当中的。那么最简单的就是直线型,这个方程,我们中学的时候就学过:
y = kx + b
我们举一个例子:我们都知道,在单位房价大体不变的情况下,住房面积越大,那么这个房子的价格就越贵。现在我们有如下数据:
那么,我们利用Matplotlib 就可以画出这个数据的分布情况:相关代码如下:
import matplotlib.pyplot as plt
plt.figure(figsize=(20,8),dpi = 80)
_x = [60,72,75,80,83,87,90,93] # 房屋面积
_y = [126,151.2,157.5,168,174.3,180,192.2,194] # 房价
plt.scatter(_x,_y)
plt.show()
画出的图如下:
可以大体看出来,横轴的住房面积,还有纵轴的房价大致符合y = kx+b的关系。像这种的,我们称之为:线性回归关系
线性回归关系是一种通过属性间的线性组合来进行预测的关系(函数),还可以往多维度推广。其表示如下:<