一、数据挖掘 1.数据挖掘定义: 从海量数据(包含文本)中挖掘出对企业有潜在价值的趋势、知识或规则,并利用这些知识或规则进行建立模型,对预测型决策进行指导的过程。 2.数据挖掘的流程: 2.1、数据抽取:要重点关注数据的质量,可以进行同环比、逻辑、日期、平衡关系校验。 2.2、数据探索:主要包括 相关性分析、、、 2.3、数据预处理: 2.4、模型建立: 2.5、模型评价: 3.数据挖掘的工具: 包含了:python,SAS、SQL Server、Spass等