Data Mining with SQL Server 2005(数据挖掘技术)
一、数据挖掘技术可以解决的一些典型商业问题。
- 客户流失分析
- 交叉销售
- 欺诈检测
- 风险管理
- 客户细分
- 广告定位
- 销售预测
二、数据挖掘的任务
- 分类
- 聚类(细分)
- 关联(购物篮分析)
- 回归
- 预测
- 序列分析(主要应用于WEB日志分析和DNA分析)
- 偏差分析(孤立点检测)
三、数据挖掘项目的生命周期
- 数据收集
- 数据清理和转换
- 数据类型转换
- 连续列转换(把值连续数据转换为桶,如把Age分成预定义的5个年龄段)
- 分组
- 聚集
- 缺失值处理
- 删除孤立点