第一章 绪论
什么是数据挖掘?
数据挖掘用来发现先前未知的有用模式,还可以预测未来观察结果。
数据挖掘任务
通常数据挖掘任务分为两类:
一、预测任务:根据其他属性的值,预测特定属性的值
- 预测建模:
回归:用于预测连续的目标变量 例: 预测股票价格
- 异常检测:用于识别特征显著不同于其他数据的观测值。 例:信用卡欺诈检测
- 聚类分析:用于发现紧密相关的族群,使得族内尽可能相似,族间尽可能不同 例:文档聚类
- 关联分析:用于发现描述数据中强关联特征的模式。用蕴含规则或特征子集来表示。例:啤酒和尿布