数据挖掘大作业最终报告
数据挖掘
大作业最终报告
学 院:计算机学院
专 业:计算机应用技术
年 级:2016级
组 号:第六组
成 员:赵 颖 2620160012
王晓媛2620160007
李昱燃2620160009
用户行为预测——以某电信公司为例
摘要
本文讨论了一个关于用户行为预测的数据挖掘问题,在对某电信公司客户数据集的处理、
Random Forest AdaBoost
特征选取之后,尝试使用随机森林 ( )、与 结合的决策树、梯度提升
决策树 (Gradient BoostingDecision Tree)三种算法进行分类,最终较好地实现了对客户忠诚
度、购买欲、增值性三个属性的预测,并且对三者的结果进行了分析和比较。
关键词:特征选取、决策树、分类器
1 导论
1.1 问题描述
本文所尝试解决的问题是根据2009年KDD Cup 竞赛的问题改编而来,目的是预测客户三
个维度的行为,包括:1、忠诚度(Churn):用户切换运营商的可能性;2、购买欲(Appetency):
购买新服务的可能性;3、增值性 (Up-selling):客户升级或追加购买高利润产品的可能性。
我们需要根据现有数据训练出分类器,分别对客户的忠诚度、消费欲和增值服务倾向性做出二
元判别,并计算各分类器的准确率,比较它们的分类效果。
竞赛中的数据集来自法国Orange 电信公司的