机器学习与R语言多元线性回归insurance.R：保险费

sereasuesue

于 2019-04-28 12:00:39 发布

阅读量2.9k

点赞数 2

分类专栏： Python 深度学习数据分析文章标签：多元线性回归insurance.R：保险费

本文链接：https://blog.csdn.net/sereasuesue/article/details/89634915

版权

Python 深度学习同时被 2 个专栏收录

70 篇文章 16 订阅

订阅专栏

数据分析

23 篇文章 8 订阅

订阅专栏

insurance <- read.csv("insurance.csv", stringsAsFactors = TRUE)
str(insurance)

#既然因变量是charges,我们就来看一下它是如何分布的
summary(insurance$charges)
hist(insurance$charges)

table(insurance$region)
cor(insurance[c("age","bmi","children","charges")])
pairs(insurance[c("age","bmi","children","charges")])

library("psych")
pairs.panels(insurance[c("age","bmi","children","charges")])
#lm代表线性回归算法
ins_model <- lm(charges ~ age + children + bmi + sex + smoker + region, data=insurance)
ins_model <- lm(charges ~ . , data=insurance)
ins_model
summary(ins_model)

insurance$age2 <- insurance$age^2
insurance$bmi30 <- ifelse(insurance$bmi >= 30, 1, 0)

ins_models <- lm(charges ~ age + age2 + children + bmi + sex + bmi30*smoker + region , data=insurance)
summary(ins_models)

sereasuesue

关注

2
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
机器学习与R语言多元线性回归insurance.R：保险费

insurance <- read.csv("insurance.csv", stringsAsFactors = TRUE)str(insurance)#既然因变量是charges,我们就来看一下它是如何分布的summary(insurance$charges)hist(insurance$charges)table(insurance$region)cor(insura...
复制链接

扫一扫