1.医疗保险公司为了赚钱,需要募集比花费在受益者的医疗服务上更多的年度保费。因此保险公司投入了大量时间和金钱来研发能精确预测用于参保人医疗费用的模型。在附件insurance.csv中
- age表示主要受益者的年龄;
- sex表示受益者的性别;
- bmi表示身体质量指数;
- children表示保险计划中包括的孩子数量;
- smoker表示保险人是否经常抽烟;
- region表示受益人在美国的居住地;
- expenses表示的则是年度保险计划的每个人的医疗费用;
- region表示受益人在美国的居住地。
1)读取附件中insurance.csv文件;
q1 <- read.csv("附件/insurance.csv")
attach(q1)
head(q1)
2)使用一个函数查看expenses的主要统计量(中位数,最大值,最小值等等);
summary(expenses)
3)使用直方图来验证保险费用expenses的分布是左偏还是有偏?
hist(expenses)