一数据处理
读入数据集后
首先去除原数据集中无用的数据。
剩下的干净数据如下图
二.特征分析
将三种特征分别提取再合并,然后进行标准化处理
之后进行K-MEANS分析,聚类中心设为5
三.K-MEANS分析
得到聚类中心
得到不同类别样本的数目
四.作图
五.风险评估
历史行为特征:‘瑕疵户’,‘逾期’,‘呆账’,‘强制停卡记录’,‘退票’,‘拒往记录’
经济风险特征:‘借款余额’,‘个人月收入’,‘个人月开销’,‘家庭月收入’,‘月刷卡额’
收入风险特征:‘职业’,‘年龄’,‘住家’
由此观之
一般客户:客户群1
重发展客户:客户群5,客户群3
重保持客户:客户群2
低价值客户:客户群4
分析:
本次分析,
①得出风险最高的时客户群4类的用户,该用户月刷卡消费额度大,但历史行为差,没有良好的个人纪录。应重点监控或减缩该类用户的信用卡权限。
②客户群5类的用户,个人收入,家庭收入高,有良好的历史记录但个人开销与年龄较低。值得信任。
③客户群1,2,3 都有良好的历史记录,其他特征较普通,属于低风险人群