一、挖掘过程分析
知识发现(KDD)是从数据中发现有用知识的整个过程
个过程定义:从数据中鉴别出有效模式的非平凡过程,该模式是新的、可能有用的和最终可理解的。
知识发现主要步骤(如图1.3):
1)数据清洗:清除数据噪声和无关数据
2)数据集成:将来自多数据源中的数据集合到一起
3)数据转换:将数据转换为易于进行数据挖掘的数据存储形式
4)数据挖掘:利用智能方法挖掘数据模式或规律知识
5)模式评估:根据一定评估标准从挖掘结果中筛选出有意义的知识
6)知识表示:利用可视化和知识表达的技术,向用户展示所挖掘的相关知识