分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
用
最小二乘法估计参数b,设服从正态分布,分别求对a、b
线性回归方程求法 的偏导数并令它们等于零,得方程组解为 其中 ,且为观测值的
样本方差.
线性方程称为关于的线性回归方程,称为
回归系数,对应的直线称为
回归直线.顺便指出,将来还需用到,其中为观测值的样本方差. 先求x,y的平均值
X,Y 再用公式代入求解:b=(x
1y
1+x
2y
2+…x
ny
n-n
XY)/(x
1
2+x
2
2+…x
n
2-n
X
2) 后把x,y的平均数
X,Y代入a=
Y-b
X 求出a并代入总的公式
y=bx+a得到线性回归方程 (X为xi的
平均数,Y为yi的平均数) Python sklearn中的LinearRegreesion实例
import pandas as pd
from sklearn.linear_model import LinearRegression