1.请用一句话介绍数据挖掘?
数据挖掘是从大量数据中发现有趣知识的过程;它涉及多个交叉学科,如统计、机器学习、信息检索、模式识别、生物信息;它应用领域广泛,如电子商务、零售、金融、通信、社交媒体。
2.数据挖掘主要包含哪些技术?
分类与预测、聚类、离群点检测、关联规则、序列分析、时间序列分析、文本挖掘、社交网络分析与情感分析。
3.请举出数据挖掘实施的流程与步骤?
CRISP-DM(Cross Industry Standard Process For Data Mining,数据挖掘的跨行业标准过程)。分6个步骤:业务理解、数据理解、数据预处理、建模、评估、部署。