使用线性回归来进行每个人的平均医疗费用预测

最新推荐文章于 2023-09-17 00:12:29 发布

Yang_Fei_Long

最新推荐文章于 2023-09-17 00:12:29 发布

阅读量2.9k

点赞数

分类专栏： http://img.blog.csdn.net/20171015002142309?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvWWFuZ19GZWlf 文章标签： r语言数据分析算法预测

本文链接：https://blog.csdn.net/Yang_Fei_Long/article/details/78245643

版权

先贴出代码如下:

insurance<-read.csv("insurance.csv",stringsAsFactors = FALSE)
ins_model<-lm(expenses~.,data = insurance)
summary(ins_model)

(

ins_model<-lm(expenses~.,data = insurance)

这句话的意思就是以insurance为数据源,建立expenses和数据源其他属性的(一次)线性关系. "."表示其他所有属性

)

R语言分析数据的一个很大的优势就是它有很多的第三方包，可以很方便我们使用。所以上面的代码很简介。但是，我们关键是要知道怎么来分析数据。

首先我们先看看结果吧:

1.Residuals表示残差，顾名思义，就是指预测的数据和实际的数据的差值。从四分图可以看出，最大和最小的误差值都挺大的，这说明了线性回归算法在预测极端值的时候，效果并不是很理想。但是可以看出1Q,Median,3Q (也就是在1/4值，1/2值,3/4值)的差距不是很大，所以可以判断出整个

关注