o(* ̄▽ ̄*)ゞ 定义:数据挖掘,又称为数据库知识发现,它是一个从大量数据中提取、挖掘未知的,有价值的模式、规律等知识的复杂过程。
描述:按既定决策目标,对大量数据进行探索和分析,揭示隐藏的、未知的或验证已知属性,并进一步将其模型化的先进有效方法。
区别:与传统数据分析(如查询、报表、联机应用分析)又有本质区别。数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。同时,数据挖掘所得到的信
息应具有先前未知、有效和可实用三个特征。挖掘出的信息越是出乎意料,反而可能越有价值。
o(* ̄▽ ̄*)ゞ 过程模型:SPAA的5法:访问Access、分析Analyze、评估Assess、行动Action、自动化Automate。
SAS的SEMMA法:抽样Sample、探索Explorer、建模Model、修正Modify、评估Assess。
CRISP-DM跨行业数据挖掘过程标准(最权威)。