浅谈简单线性回归(Simple linear regression)part2ANOVA
ANOVA(方差分析(Analysis of Variance,简称ANOVA))
目的:用于表达我们的模型有多拟合数据
就是一张表
关于这类表,有个推论:TSS = SSE + RSS
其中,回归平方和:ESS,残差平方和:RSS,总体平方和:TSS。
即总体平方和=回归平方和+误差平方和(总体=预测+误差)
参数说明:
(1) 实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和的总和表示,记作SSb,组间自由度dfb。
(2) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示, 记作SSw,组内自由度dfw。
总偏差平方和 SSt = SSb + SSw。
组内SSw、组间SSb除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MSw和MSb,一种情况是处理没有作用,即各组样本均来自同一总体,MSb/MSw≈1。另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,MSb>>MSw(远远大于)。
MSb/MSw比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体 。
R**2=残差平方和/总体平方和→用于表示模型的拟合度,数值越接近1代表得到的回归方程越好或越适合(模型拟合越好)
SSR即RSS,SST即TSS,其他同理