数据挖掘简介及学习路径介绍

1.数据挖掘经典案例

1、预测未来一段时间用户是否会流失
2、某个促销活动用户是否会响应参加
3、评估用户信用度是好还是差
4、细分现有的目标市场
5、对现有客户群进行群体细分
6、提升商品销售及交叉销售
7、一群用户购买了很多商品之后,哪些商品同时购买的几率比较高
8、预测未来的销量
9、天气预报中预测明天的气温是怎样的
10、国家的年底规划中,预测明年的GDP增长率是怎样的
数据挖掘要做的就是把上述类似的商业问题转化为数据挖掘问题

2.数据挖掘问题分类

  1. 分类问题
    促销活动响应,评估用户度都属于数据挖掘的分类问题,常见的分类方法:决策树、贝叶斯、KNN、支持向量机、神经网络和逻辑回归等。
  2. 聚类问题
    细分市场,细分客户群体都属于数据挖掘的聚类问题,常见的聚类算法:划分聚类、层次聚类、密度聚类、网格聚类、基于模型聚类等。
  3. 关联问题
    交叉销售问题等属于关联问题,关联分析也叫购物篮分析,常见的关联分析算法:Aprior算法、Carma算法,序列算法等。
  4. 预测问题
    通常,预测是通过分类或估值起作用的其目的是对未来未知变量的预测,常用的方法:简单线性回归分析、多重线性回归分析、时间序列等。

3.数据挖掘过程

  1. 确定业务对象
    清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步.挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的.
  2. 数据准备
    1)、数据的选择
    搜索所有与业务对象有关的内部和外部数据信息,并从中选择

  • 4
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值