线性回归(regression to the mean)
线性回归称作广义线性回归(GLM generalized linear model),广义线性回归包括多元线性回归、逻辑回归(Logistic regression)、泊松回归(Poisson regression)
回归 regression
回归指的是回归到平均值mean,通过大量的数据进行计算,得到平均值,得到模型,然后使用模型进行预测。
那么平均值mean指的是什么呢?我的理解就是y = w0 w 0 + w1 w 1 x1 x 1 + w2 w 2 x2 x 2 + …… + wn w n xn x n 方程中的y值。但是通常理解y是结果,y值为什么是均值呢?那么先要从均值(平均值)聊起。
均值,其实是针对实验观察到的特征样本而言的。比如我们实验结果得出了 x1 x 1 , x2 x 2 , x3 x 3 ….. xn x n 这n个值,那么我们的均值计算是
x1+x2+x3+…..+xnn x 1 + x 2 + x 3 + … . . + x n n
比如我们进行掷骰子,掷了六次,点数分别为2,2,2,4,4,4,这六次的观察就是我们的样本,于是我们可以说均值为(2+2+2+4+4+4)/6=3。那么这个公式怎么看上去都和回归方程长得不一样,但是将均值的公式变换一下:
(2+2+2+4+4+4)/6 = 3
3 = (2+2+2+4+4+4)/6
3 = 1/6*2 + 1/6*2 + 1/6*2 + 1/6*4 + 1/6*4 + 1/6*4
再看上面这个公式是不是和回归方程有点像了呢?如果将3看做y,2,2,2,4,4,4看做 x1