1.数据挖掘经典案例
1、预测未来一段时间用户是否会流失
2、某个促销活动用户是否会响应参加
3、评估用户信用度是好还是差
4、细分现有的目标市场
5、对现有客户群进行群体细分
6、提升商品销售及交叉销售
7、一群用户购买了很多商品之后,哪些商品同时购买的几率比较高
8、预测未来的销量
9、天气预报中预测明天的气温是怎样的
10、国家的年底规划中,预测明年的GDP增长率是怎样的
数据挖掘要做的就是把上述类似的商业问题转化为数据挖掘问题
2.数据挖掘问题分类
- 分类问题
促销活动响应,评估用户度都属于数据挖掘的分类问题,常见的分类方法:决策树、贝叶斯、KNN、支持向量机、神经网络和逻辑回归等。 - 聚类问题
细分市场,细分客户群体都属于数据挖掘的聚类问题,常见的聚类算法:划分聚类、层次聚类、密度聚类、网格聚类、基于模型聚类等。 - 关联问题
交叉销售问题等属于关联问题,关联分析也叫购物篮分析,常见的关联分析算法:Aprior算法、Carma算法,序列算法等。 - 预测问题
通常,预测是通过分类或估值起作用的其目的是对未来未知变量的预测,常用的方法:简单线性回归分析、多重线性回归分析、时间序列等。
3.数据挖掘过程
- 确定业务对象
清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步.挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的. 数据准备
1)、数据的选择
搜索所有与业务对象有关的内部和外部数据信息,并从中选择