商业智能BI、数据仓库DW、数据挖掘DM三者之间的关系
商业智能相对于数据仓库、数据挖掘是一个更大的概念,可以说是基于数据仓库,经过数据挖掘后,得到商业价值的过程。
数据仓库是数据库的升级概念,存储的数据量更大,将原有的多个数据源中的数据汇总整理得到,进入数据仓库前,必须消除不一致性。
数据挖掘的核心包括分类、聚类、预测、关联分析等任务。
元数据VS数据元
元数据:描述其他数据的数据,使信息的描述和分类实现了结构化。
数据元:最小的数据单元
数据挖掘的流程
数据挖掘的一个英文解释为Knowledge Discovery in Database,KDD,也称为数据挖掘中的知识发现。
知识发现过程:
(1)输入数据
(2)数据预处理:特征选择、维规约、规范化、选择数据子集等
(3)数据挖掘
(4)后处理:模式过滤、可视化、模式表示
(5)信息