先贴出代码如下:
insurance<-read.csv("insurance.csv",stringsAsFactors = FALSE)
ins_model<-lm(expenses~.,data = insurance)
summary(ins_model)
(
ins_model<-lm(expenses~.,data = insurance)
这句话的意思就是以insurance为数据源,建立expenses和数据源其他属性的(一次)线性关系. "."表示其他所有属性
)
R语言分析数据的一个很大的优势就是它有很多的第三方包,可以很方便我们使用。所以上面的代码很简介。但是,我们关键是要知道怎么来分析数据。
首先我们先看看结果吧:
1.Residuals表示残差,顾名思义,就是指预测的数据和实际的数据的差值。从四分图可以看出,最大和最小的误差值都挺大的,这说明了线性回归算法在预测极端值的时候,效果并不是很理想。但是可以看出1Q,Median,3Q (也就是在1/4值,1/2值,3/4值)的差距不是很大,所以可以判断出整个