第五章 线性回归
对于一个给定的数据集,我们想用线性回归来进行预测
fitted.regression <- lm(y~x,datasource)接下来要进行直线的位置参数的求解
[intercept slope] = ceof(fitted.regression)求解出直线以后,要对我们求出的直线进行评估,主要通过残差平方和
errors <- residuals(fitted.regression)
squred.errors <- errors ^ 2但是残差平方和会受到数据集大小的影响,所以使用残差平方和的均值MSE
mse <- mean(squared.errors)然而平均偏离量较大时,还是会把这种偏离的影响扩大,因为是先求了平方再求得均值,所以用均方误差 RSME
rsme <- sqrt(mse)但是我们没有一个标准说RSME到多大是不好的,所以我们R^2来解决
r2 <- 1- (model.rmse/mean.rmse)