标题在统计学中,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。
简单对来说就是用来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
一元线性回归分析法的数学方程:
从最简单来看,如果数据是一个一元线性回归,那么方程就变成:y = b0 + b1x,此时可以直接用least square方法计算得到b0,b1。R语言实现如下:
train <- read.csv('train.csv&#