数据分析: 保险公司用户价值分析与用户画像
目录
一、分析目的
1,背景意义
对于保险公司来说,客户满意度和忠诚度是企业发展的重要资源之一,而以往对于客户关系管理即CRM存在些许不足,缺乏客户细分与客户定位能力,故利用客户数据库的客户数据信息,分析客户需求与偏好进行分类管理,针对性提供服务,能有效发展公司业务。
2,目标
借助保险公司客户数据,对客户进行分类,区分客户类别,判断公司主要的目标客户群体,比较不同类别客户的价值与潜在需求;
对不同客户进行属性分析,通过结合不同标签,生成客户画像,达到精细化运营;
针对不同的客户采取不同的营销手段,制定对应的营销策略,解决市场细分问题。
3,内容
综合多个特征的隐含联系,采用无监督学习的Kmeans算法及层次聚类算法对客户进行聚类,划分人群。
对划分的不同类别客户群体,进行客户价值分析,筛选出最符合目标的重要客户群体,并对不同客户群体的特征进行对比分析。
结合客户群体与数据标签,对目标客户建立用户画像,以实现数据场景变现。
二、分析结果(过程与图表详见下文)
1,客户群体划分
利用Kmean聚类与层次聚类算法,挖掘客户隐藏特征,将客户划分为低端节约型客户、中端享受型客户、中端居家型客户、中端外向型客户、高端居家型客户5种客户群体。
2,筛选目标客户
根据用户得分、企业得分综合评估不同群体客户的价值。
1)中端外向型以及高端居家型客户选择本公司较多,为公司重要客户,同时也应注重此类客户关系的维护,保证客户留存。
2)同时,最吸引本公司的客户为中端居家型客户,再者是中端外向型客户,此类客户数量与保险金额加权较高,应针对这些客户多进行宣传与拉新。
3)而低端节约型客户,中端享受型客户,对于本公司来说,具有的价值最低,可酌情降低投入程度。
3,客户属性分析
1)在各项保险增值服务中, 客户更多地考虑产品个性化因素,优于考虑一站式服务考虑程度以及网上投保考虑程度,公司可在各项服务中,投入更多精力于产品个性化设计。
2)客户选择保险公司时,更看重的因素在于服务网点多,亲朋推荐,以及信任销售人员,公司吸引新客户可更多按照这些方向,反映了保险业务的拓展更依赖于熟人社会,基于人际关系网络的社交属性明显。
3)不同类别客户的自然属性中,以年龄、城市、家庭月收入、汽车价格特征等差别较大。
4,目标客户画像
以中端外向型目标客户群体为例,基于标签含义,建立目标画像。可以刻画用户画像为:
小明,男,32岁。本科毕业,目前家庭月收入2.8W,拥有一辆20W的汽车。
性格活泼,喜爱户外运动,对生活充满激情,不喜欢一成不变的生活,勇于挑战新事物,对目前生活很满意。在保险投入上,投保金额较高,且选择本公司的意愿较高。
三、分析过程
1、数据预处理
1)导入模块
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.preprocessing import StandardScaler
import factor_analyzer
from factor_analyzer import FactorAnalyzer
from sklearn.manifold import TSNE
import matplotlib.patheffects as PathEffects
from sklearn.cluster import KMeans
from scipy.cluster import hierarchy
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
#正常显示中文
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimHei']
#正常显示符号
from matplotlib import rcParams
rcParams['axes.unicode_minus']=False
2)数据清理
df=pd.read_csv('insurance_customer.csv',encoding='utf-8-sig')
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 712 entries, 0 to 711
Data columns (total 30 columns):
问卷编号 712 non-null int64
是否购买车险 712 non-null int64
性别 712 non-null int64
年龄 712 non-null int64
城市 712 non-null int64
学历 712 non-null int64
家庭月收入 712 non-null int64
职业 712 non-null object
汽车价格 712 non-null int64
决策时间 712 non-null int64
是否收集信息 712 non-null int64
从什么渠道收集信息 712 non-null object
投保渠道 712 non-null int64
保险公司的选择 712 non-null int64
保费金额 712 non-null float64
索赔经历 712 non-null int64
一站式服务考虑程度 712 non-null int64
网上投保考虑程度 712 non-null int64
产品个性化考虑程度 712 non-null int64
选择保险公司的考虑因素 712 non-null int64
满意度 712 non-null int64
对自己的生活很满意 712 non-null int64
为享受而产生的浪费是必要的 712 non-null int64
买房子前要先有车 712 non-null int64
不惜金钱和时间装修房子 712 non-null int64
买衣服都买便宜的 712 non-null int64
休息时经常进行户外活动 712 non-null int64
尝试生活充满变化 712 non-null int64
喜欢独自享受安静的生活 712 non-null int64
下班后尽快回家 712 non-null int64
dtypes: float64(1), int64(27), object(2)
memory usage: 167.0+ KB
df.head()
问卷编号 是否购买车险 性别 年龄 城市 学历 家庭月收入 职业 汽车价格 决策时间 是否收集信息 从什么渠道收集信息 投保渠道 \
0 1 1 1 1 6 2 1 5 1 1 1 3 4
1 2 1 2 1 7 2 1 1 1 1 1 1 1
2 3 1 1 1 6 1 2 6 1 1 2 4
3 4 1 1 3 5 2 2 6 3 1 1 2 2
4 5 1 1 3 5 2 1 2 3 3 2 2
保险公司的选择 保费金额 索赔经历 一站式服务考虑程度 网上投保考虑程度 产品个性化考虑程度 选择保险公司的考虑因素 满意度 \
0 3 870.0 2 1 1 7 4 1
1 3 1199.7 1 5 4<