线性回归
线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w'x+e,e为误差服从均值为0的正态分布。
线性回归的优点
1.速度快,一旦训练完毕,就不再需要数据集
2.线性回归是所有机器学习的基础,概念非常重要
为什么需要线性回归
试图找到自变量与因变量之间的关系
线性回归就是求解m和b的过程
代码
import numpy as np
data = np.array([
[80,200],
[95,230],
[104,245],
[112,247],
[125,259],
[135,262]
])
import matplotlib.pyplot as plt
%matplotlib notebook
fig = plt.figure(figsize=(6,6),dpi=80)
plt.xlim(70,140)
plt.ylim(0,300)
plt.scatter(data[:,0],data[:,1],c='r',marker='o',label='like')
plt.show()
MAE vs MSE
MAE:mean absolute error最小绝对差
MSE:mean square error 最小均方差
MSE计算公式