商业银行客户流失的影响因素分析——基于sas数据挖掘

目录
一、 绪论 1
(一) 研究背景及意义 1
(二) 国内外研究现状 1
(三) 论文研究内容与结构 2
二、 准备变量 4
(一) 初步筛选变量 4
1. 根据数据质量筛选变量 4
2. 从用户生命周期分析客户流失的可能影响因素 5
3. 确定初选变量 6
(二) 预测变量与目标变量的相关性 7
1. 分类变量的直方图检验 7
2. 分类变量的卡方检验 11
3. 连续变量与目标变量的相关性检验 12
(三) 预测变量之间的相关性检验 14
1. 变量之间相关性检验 15
2. 模型多重共线性的检测 16
三、 建立模型 17
(一) 主成分分析 17
(二) Logistic 回归建模 19
1. Logistic 回归 19
2. Logistic回归结果分析 20
四、 模型的效果评估 23
五、 减少银行客户流失的策略 25
(一) 大客户营销 25
(二) 个性化服务 25
(三) 交叉营销 26

确定初选变量

根据数据的质量和现实直观影响考量,我们从150个变量中选出了36个变量,如表 1所示,
表 1变量列表

变量分类 变量 变量标签
客户基本情况 X1 开户时长
X2 是否金普卡
X3 是否标准白金卡
X4 是否豪华白金卡
X5 是否钻石卡
客户持有产品的情况 X6 客户持有的全部产品数量(24种产品)
X7 持有定期存款标志
X8 持有活期产品标志
X9 持有国债标志
X10 持有基金标志
X11 持有信用卡产品标志
X12 个贷标识
客户资产负债情况 X13 资产总额
X14 最近3个月客户月平均资产总计
X15 最近3个月客户月平均负债总计
跨行转账情况 X16 最近三个月转入金额
X17 最近三个月转出金额
X18 最近三个月客户跨行同名转入月平均金额
X19 最近三个月客户跨行非同名转入月平均金额
X20 最近三个月客户跨行同名转出月平均金额
X21 最近三个月客户跨行非同名转出月平均金额
X22 最近三个月客户跨行非同名转入月平均次数
X23 最近三个月客户跨行同名转出月平均次数
客户账户交易 X24 最近三个月内 账户 借方月均交易金额
X25 最近三个月内 账户 借方月均交易次数
X26 最近三个月内账户贷方月均交易金额
X27 最近三个月内账户贷方月均交易次数
客户理财情况 X28 是否薪资理财
X29 理财金额
X30 基金金额
X31 国债金额
X32 银保通金额
X33 贵金属金额
客户账户数量 X34 三个月月均新增存款账户数
X35 三个月月均存款账户总数
X36 累计销户数目
图表来源:根据收集到的数据绘制

X1到X5是客户的基本信息情况,例如客户价值等级和开户时长等等;X6-X12为客户持有产品情况,如果客户拥有一家银行的产品和服务种类越多,他与银行的联系就越多,客户就不会轻易离开;x13-x15是客户资产负债状况,从实际业务的角度出发,客户在该银行的资产越多,表明客户对该银行越认同 , 因此流失倾向越小,反之越高;X 16-X27是客户的账户交易和跨行转账信息,反映出客户的活跃程度和是否有流失倾向,如果客户存在不断转出账户金额的行为,则客户可能有流失倾向;X28-X33代表客户的理财,包含理财产品的类型、金额以及是否薪资理财等,能看出客户对该银行的产品是否满意,由此推测客户是否有流失意愿;X34-X36是客户账户数量,开户数量越多,说明该客户拥有这家银行的产品越多 , 客户就不会轻易离开。

(二) 预测变量与目标变量的相关性

筛出的36个变量中涉及了两种变量,分别是分类变量和连续变量。我们采取直方图的方法和卡方检验来检验分类变量的预测能力,运用pearson相关系数来做检验。
1. 分类变量的直方图检验
利用柱状图描述客户流失率随每个变量分类的变化,来初步推测变量对客户流失是否有较好的预测能力。

图 3 最高国际卡级别直方图

图表来源:根据收集到的数据绘制
根据现实意义,随着客户价值等级的升高,客户流失率应该是越来越低的,图 3 最高国际卡级别直方图显示随着最高国际卡的级别的上升,流失率反而越来越高。通常我们认为客户等级越高,银行给的待遇也越好,因此越不会轻易流失,但也存在另一种情况,随着客户等级越高,各个银行对该客户的争夺越激烈,客户的可选择空间也越大,导致高等级的客户更容易流失。
图 4持有活期产品直方图

图表来源:根据收集到的数据绘制
由图 4发现账户里有活期产品的客户流失率比没有活期产品的客户高,这是因为活期产品主要是一年以内的产品,如果客户单纯是开这个账户来购买活期产品,在这一期产品结束后,他们选择离开的概率也会比较高,这符合现实意义。

图 5是否薪资理财的流失百分比

图表来源:根据收集到的数据绘制
图 6可以看出,有在银行进行薪资理财的客户流失率比较低,没有进行薪资理财的客户流失率比较高,这是因为有理财的客户还需要在这个账户会进行一些交易,他们短时间不会流失。
图 6 是否持有定期存款的流失百分比

图表来源:根据收集到的数据绘制
从图 7可知,持有定期存款的客户流失率较小,与实际情况相符,因为能够把钱长期存在该银行,说明该客户对该银行的忠诚度较高。

图 7 是否持有国债的流失百分比

图表来源:根据收集到的数据绘制
从图 8可知,持有国债的客户流失率较低,由于国债的一般为3 / 5年期,客户在该银行购买了国债,至少在国债到期前不会不会轻易流失。
图 8 是否持有基金的流失百分比

图表来源:根据收集到的数据绘制
从图 9可知,持有基金的客户与没有持有基金的客户相比,更不容易流失,从一般情况来看,如果一个客户持有的一家银行基金类型的产品,说明了该客户对该银行的基金产品较为满意,因此不会轻易流失。
可以得出结论,是否持有活期产品、是否薪资理财、是否持有定期存款、是否持有国债以及是否持有基金,都对客户是否流失有影响,并且影响的方向与实际业务相符。最高卡级别与客户流失之间的关系不符合实际的业务现象,可能原因有高质量客户在各个银行之间的争夺比较激烈,因此导致客户虽然等级越高却流失率越高,具体的原因有待进一步探索。

2. 分类变量的卡方检验

前面的直方图初步展示了自变量与因变量的关系,这一节用卡方检验进一步检验变量对客户流失预测能力的大小。卡方检验是用于做假设检验的一种办法,它的原理主要检验两个及两个以上的样本比率之间的存在的相似度,还有两个分类类型的变量的之间是否有关联。最基本的想法就是比较统计意义上的理论的频数和实际计数数出来的频数的吻合程度[10]。卡方检验如下表 2所示,
表 2分类变量的卡方检验
变量 变量名称 变量标签 卡方 p
X2 CUST_GOLD_COMMON_FLAG 是否金普卡 33.193 <0.0001
X3 CUST_STAD_PLATINUM_FLAG 是否标准白金卡 407.319 <0.0001
X4 CUST_LUXURY_PLATINUM_FLAG 是否豪华白金卡 16.831 <0.0001
X5 CUST_DIAMOND_FLAG 是否钻石卡 55.182 <0.0001
X6 CUST_PRODUCT_CNT 客户持有的全部产品数量
(24种产品) 555.615 <0.0001
X7 DEP_TD_FLAG 持有定期存款标志 299.135 <0.0001
X8 DEP_SA_FLAG 持有活期产品标志 33.901 0.084
X9 BOND_FLAG 持有国债标志 3.433 0.064
X10 FUND_FLAG 持有基金标志 13.358 <0.00

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值