1.数据挖掘概念:从这些数据中提取有价值的信息和知识以帮助做出明智的决策成为巨大的挑战;
2.数据挖掘的任务:数据挖掘的任务可以分为预测行任务和描述型任务。预测型任务就是根据其他属性的值预测特定属性的值,如回归分类,离群点检测等。描述型任务就是寻找、概括数据中潜在联系的模式,如聚类分析、关联分析、演化分析、序列模式挖掘;
3.数据挖掘的应用:数据挖掘就是为大数据而生的,有大量数据的地方就有数据挖掘的用武之地。目前,应用较好的领域或行业有生物信息学、电信业、零售业以及保险、银行、证券等金融领域;
4.数据挖掘过程:数据挖掘只是数据挖掘过程的一部分,完整的挖掘过程还应包括以下步骤:定义业务目标、甄别数据源、收集数据、选择数据、数据质量检查、数据转换和结果解释;
5.数据挖掘方法:
①预估模型,包括分类和预估两种类型;
②聚类技术;
③连接技术;
④时间序列分析。