摘要
本文以某财产保险公司的汽车保险数据为样本,包括了保单类型、车辆驾驶人性别、年龄、车龄、驾驶人年龄分组、车辆所属地区、车年数、索赔次数和保险期间的累计赔付总额。运用python对数据进行描述性分析、相关分析及分类分析,同时运用逻辑回归模型算法对客户是否会发生索赔进行预测。分析得出影响客户索赔的几个因素,为财产保险公司进行合理规划风险客户提出建议,帮助保险公司规避风险。
该报告相关代码在:https://www.heywhale.com/mw/project/6409b11b96002ef5b01e54ac
关键字
保险公司汽车保险描述性分析分类分析逻辑回归模型预测
引言
索赔是保险公司经常需要处理的业务,把索赔发生的概率、以及在什么情况下了解索赔发生的概率最大掌握住,是保险公司规避风险的重要工作。降低索赔次数可以帮助保险公司实现更多的利润,同时,也有助于保险公司保持稳健经营。本次分析的目的是通过对某财产汽车保险公司的保险数据的分析,找到对汽车保险发生索赔概率的影响因素。
研究背景与研究目标
研究背景
随着汽车行业的发展,汽车保险公司的业务也在不断发展,现阶段汽车保险公司通过对保险索赔数据的收集分析,数据挖掘能够找到影响索赔的因素,从而帮助保险公司规避风险。本文数据来自网络,为某个财产保险公司的部分汽车保险数据。
研究目标
通过汽车保险数据预测索赔发生概率。通常保险公司会通过客户的数据来判断该客户是否会对公司进行索赔。通过已收集到的客户信息及索赔发生情况来预测索赔发生概率,同时为保险公司提出合理化建议。
数据收集与数据预处理
数据收集
本文数据来自于网络,包含了保险公司客户的一些基本信息、索赔信息,共12873条。信息共有9个变量,字段信息如下表所示: