关于数据挖掘的概念,目前业界没有统一的定义。首先从技术角度来讲,数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的人们事先不知道的、但有存在有用的信息和知识的过程。其次从商业角度来看,它是一种新的商业信息处理技术,其主要是从商业数据库中的大量业务数据进行取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。因此它得到的信息具有先前未知、有效和可实用三个特点。
一、数据挖掘的功能
数据挖掘主要是通过历史数据来预测未来趋势及行为,做出前瞻的、基于知识的决策。因此它的功能表现在如下5个方面:
1、 自动预测趋势和行为
数据挖掘能够自动在大型数据库中寻找预测信息,以前需要进行大量手工分析的问题现在可以直接由数据本身得出结论。
2、关联分析
(其他下次再续!!!)
它可以根据历史数据的结构找出数据库中的关联网。又可以分为简单关系、时序关系、因果关系。
3、聚类