最近在学excel数据分析,感觉excel的数据分析功能很不错,在这里记录了本人的一次对某保险公司客户索赔数据的数据分析过程。
首先先理清一下数据分析的思路和步骤:
1、拿到相关的统计数据
2、根据问题思考什么样的客户意向最大,提出问题
3、根据问题,清洗数据
4、构建模型
5、数据可视化分析
(一)先拿到一份数据表(稍微处理的一个数据表格,时间列变为日期型):
(二)然后根据表格提出相关问题:
1)不同省份的索赔额情况
2)不同的年龄的索赔额分布是怎样的
3)不同时间段的索赔额分布是怎样的
4)不同性别的索赔额情况是怎样的
(三)清洗数据
1)选择需要使用到的数据,把无关的数据可以隐藏起来
字段:保险单号,损失类型,保险类型,邮编这四个字段分析师用不到,所以暂时可以隐藏掉
2)删除重复值
在这个表中,索赔单号是唯一的,所以可以根据这个来删除重复不需要的数据
可通过【数据】-【删除重复值】实现
3)缺失值处理
可通过【开始】-【查找和选择】-【定位条件】-【空值】来定位出缺失值