线性回归模型
线性回归(line regression)是一种线性模型,它假设输入变量x和单个输出变量y之间存在线性关系。
具体来说,利用线性回归,可以从一组输入变量x的线性组合中,计算输出变量y
y=ax+b
一般向量形式写成
最小二乘法
基于均方误差最小化来进行模型求解的方法为最小二乘法(least square method),它的思想就是验证未知参数使得理论值和观测值之差的平方和达到最小。
在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的欧式距离之和最小。
求解w和b就是使得E(w,b)最小化的过程。称为线性回归模型的“最小二乘参数估计”。求解过程,这里不展示,直接看结果。
现在,有一组散点图,根据上述公式,求解直线。
Python实现
引用依赖
- numpy:NumPy(Numerical Python)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵
- matplotlib:NumPy Matplotlib Matplotlib 是 Python 的绘图库。
代码讲解
1. 导入数据
import matplotlib.pyplot as plt
import numpy as np
points = np.genfromtxt('data.csv', delimiter=