一个典型的银行精准营销客群挖掘项目总结(2)

4.数据挖掘建模

        数据挖掘建模是一个过程,具体包括数据探索,数据预处理,建模,模型 评估与解释等步骤。本次项目用 SAS 工具实施,具体的过程如下所示:

4.1.数据探索

        数据挖掘的第一步是数据质量检查和数据探索,数据质量检查是发现数据 中存在的一些错误,如年龄为负,交易金额,交易次数为非常大的某个值等。 对于连续变量和离散变量,分别采用不同的方法进行描述性分析。

4.1.1.描述性分析

4.1.1.1.连续变量

        对于连续变量,主要做描述性统计,主要包括有效变量个数,均值,标准 差,最小值,最大值,偏度,峰度,分位数等。下面为部分变量的描述性统计 结果。

         从上表可以看到,年龄,贡献度最小值为负值,可以存在数据错误,需要 进行数据清洗。对于最近 6 个月月日均 AUM 平均值,最近 6 个月交易金额平均 值等变量,最大值远远超出 99 分位数,需要进行极值控制。

4.1.1.2.离散变量

        对于离散变量,主要做频数分析,即分析每个变量取值的频数分布。 下面为部分变量的频数分布分析结果:

        性别频数分析: 

        婚姻状况频次分析:

        资产等级频数分析:

4.1.2.探索性分析

4.1.2.1.连续变量

        连续变量的探索型分析主要是看自变量和目标变量的关系,将数据分成 10 等分,计算每一等分获取人数,来初步判断哪些变样对获取与否有显著的区 分能力。 下面为部分关键变量的探索结果:

  • 26
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值