一、统计学
采用特定统计手段对被测对象进行描述、推断以及预测,以达到对被测对象一定程度甚至趋近本质的了解
二、机器学习
通过计算机实现并采用特定算法发现被测对象的隐含规律和联系,并以此来作预测
三、数据挖掘
数据挖掘(Data Mining),顾名思义就是从海量数据中“挖掘”隐藏信息,按照教科书的说法,这里的数据是“大量的、不完全的、有噪声的、模糊的、随机的实际应用数据”,信息指的是“隐含的、规律性的、人们事先未知的、但又是潜在有用的并且最终可理解的信息和知识”。在商业环境中,企业希望让存放在数据库中的数据能“说话”,支持决策。所以,数据挖掘更偏向应用。
数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。机器学=统计学+计算机;