一、数据挖掘是什么?
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
- 数据源必须是真实的、大量的、含噪声的
- 发现的是用户感兴趣的知识
- 发现的知识要可接受、可理解、可运用
- 并不要求发现放之四海皆准的知识,仅支持特定的发现问题
二、大数据挖掘是什么?
数据挖掘是创建数据挖掘模型的一组试探法和计算方法,通过对提供的数据进行分析,查找特定类型的模式和趋势,最终形成创建模型。
大数据挖掘常用的算法有分类、聚类、回归分析、关联规则、特征分析、Web页挖掘、神经网络等智能算法。