机器学习 | 5种基于机器学习的客户价值预测分析方法

项目目的:预测客户的交易价值

数据来源:https://www.kaggle.com/c/santander-value-prediction-challenge

数据内容:4459条已知客户的交易价值和客户的属性(具体内容不知道,有可能是性别、年龄、收入、交税等等,每一个用户有4993条属性)

步骤:

  • 数据分析
  • 特征值选取
  • 模型建立
  • 调试

 

首先进行数据分析

有4459行,4993列,其实中1845列为float类型,3147列为int类型,有1列为object(应该为用户id)

 

观察发现特征值数量较大

初步处理:去掉常数列,去掉重复列

数据由4993变为4732

由于特征值太多,难以作图分析

直接使用所有特征值

对需要预测值分析,观察数据分布(下图左),大部分数据集中在左侧,做log处理使数据更符合高斯分布

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于数据挖掘的客户价值预测方法 赵晓煜,黄小原 (东北大学工商管理学院,辽宁沈阳%%"""*) 摘要:提出了一利用聚类和分类等数据挖掘技术预测客户价值的新方法·通过对客户历 史交易数据的分析,获得能够综合反映老客户忠诚度和价值度的指标·基于该指标对老客户进行 聚类,将老客户划分为若干个不同价值客户群,即为每个老客户赋予一个价值等级标号·利用朴 素贝叶斯分类方法来预测客户(或潜在客户)的价值,并依据预测结果来制定相应的重点客户发 展战略·实例验证了该方法的有效性和可行性· 关键词:数据挖掘;客户价值;聚类;朴素贝叶斯分类;预测 中图分类号:D!!* 文献标识码:E 在当前的竞争环境下,企业正在由以产品为 中心转向以客户为中心·为了更有针对性地开展 市场营销活动,企业特别关注如何识别和保留那 些高价值客户·因此,准确评估和预测客户价 值、正确选择目标市场成为企业能否有效进行客 户关系管理的关键[%]· 随着信息技术的快速发展和企业信息化程度 的日益提高,企业收集、处理和运用客户数据的能 力大大增强,这为进行客户行为的深入分析创造 了良好的条件·近年来,数据挖掘技术被广泛应用 于营销领域,成为了获取客户知识、支持营销决策 的重要手段[!,C]·本文提出了一基于数据挖掘 的客户价值预测方法,该方法通过对老客户交易 数据的分析来预测客户价值水平,从而为企 业制定客户发展战略提供依据· % 基于客户忠诚/价值指标的老客 户聚类 !"! 基于#$%分析计算客户忠诚/价值指标 最近购买时间(/7>70><)、购买频率 (3/

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值