数据采集策略:数据挖掘与统计学的一个区别
这个观点来自Hand等人的《数据挖掘原理》(机工,2003)。
说数据挖掘是对已经存在的数据进行分析(比如说“[原有]数据库中的知识发现”,KDD),而统计会为了回答某一个特定问题而专门去采集数据。也就是说,数据挖掘所分析处理的数据,不是为挖掘本身而收集的。
企业为了别的目的建立数据库,为了挖掘,它再从数据库的基础上建立起为分析服务的数据仓库。
转自:http://johnthu.spaces.live.com/blog/cns!2053CD511E6D5B1E!299.entry