保险行业数据分析——用户画像 精准营销

本文探讨了如何利用用户数据制作保险行业的用户画像,以实现65岁以上人群的医疗附加险精准营销。通过数据导入、探索、空值处理、变量编码和建模,发现购买比例最高的客户群体主要集中在医疗保险覆盖率低、居住年限较短的65-72岁老人,以及居住在高端小区的常住居民,建议针对这些群体进行定向推广。
摘要由CSDN通过智能技术生成

一、产品介绍
针对65岁以上的人群推出的医疗附加险,销售渠道为直邮。
二、商业目的
针对保险公司的健康险产品的用户数据,制作用户画像,找出最具有购买倾向的人群以进行精准保险营销。
三、分析流程
1 导入数据,观察数据
···了解数据样本和特征个数、数据类型、基本信息等

df.shape
df.dtypes
# 将ID转换成object
df['KBM_INDV_ID'] = df['KBM_INDV_ID'].astype('object')

···统计数据基本信息

df.describe().T

···统计空值数量

#  检查缺失列的数量
len(df.columns) - df.dropna(axis=1).shape[1]
# 统计各列中空值的数量
df_null_sum = df.isnull().sum()
# 将不为零的数据过滤出来
NA = df.isnull().sum()
NA = NA.reset_index()
NA
# 重置列名
NA.columns = ['Var','NA_count']
NA
# 过滤出大于0的数据
NA = NA[NA.NA_count>0].reset_index(drop=True)
NA
# 把空值个数,换算成比例
NA.NA_count/df.shape[0]

···查看数据中是否有重复值

df[df.duplicated()]

2 探索数据及数据可视化分析

import matplotlib.pyplot as plt
import seaborn as sns

plt.style.use('seaborn')
# 支持中文
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=F
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值