机器学习(五)-保险保费的多元线性回归模型案例

1. 项目描述

保险公司对个人投保时或根据历史数据生成的模型来计算个人保费,那么本次我们就以这个模型的求解过程为例来实践下多元线性回归。

2 数据与简单分析

数据信息如下图所示:
数据集下载
在这里插入图片描述

我们已经获取到保险公司部分数据,文件名为insurance.csv,文件内容如下。
我们可以看出数据中共有六个维度:age(年龄),sex(性别),bmi(肥胖指数),children(孩子数量),smoker(是否吸烟),region(居住地)。charges则是当前数据人上年度在保险的额度。
所以我们可以构建一个六维高维空间来求解这个模型。

  • 相对于年龄来说, 年龄越大, 购买保险的金额应该越大;
  • 相对于性别来说,整体女性的寿命大于男性寿命大约10年, 因此男性的保险额度应该更大。
  • 相对于肥胖指数来说, 肥胖指数越小, 身体状况越不好, 购买保险的金额应该越大;
  • 相对于孩子的数量来说, 孩子的数量越多, 压力越大, 越劳累, 购买保险的金额应该越大;
  • 相对于是否吸烟来说, 吸烟的人寿命远少于不吸烟的寿命, 因此 购买保险的金额应该越大;
  • 相对于地区来说, 地区环境越差, 有雾霾, 则越容易生病, 那么购买保险的金额应该越大;
    最后说明一下,本章中的数据来源主要是来自某保险公司内部的真实历史数据。

3 项目实践

完成本项目后,您将知道:

  • 如何从训练数据中估计统计量。
  • 如何从数据估计线性回归系数。
  • 如何使用线性回归预测新数据。
import pandas as pd
import numpy as np
import  matplotlib
  • 6
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 10
    评论
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值