目录
开口闭口大数据,可是,数据从哪里来呢?需要挖出来。有一个很形象的比喻,煤矿、石油需要挖掘,其实数据也同样需要挖掘。
什么是数据挖掘?
通常,当有人谈论“采矿”时,它涉及到人们戴着头盔和灯,在地下挖掘自然资源。虽然想象一些人在隧道中挖掘成批的 0 和 1 可能会比较形象,但这并不能完全回答“什么是数据挖掘”。
数据挖掘是分析大量信息和数据集、提取(或“挖掘”)有用情报以帮助企业解决问题、预测趋势、降低风险和发现新机会的过程。数据挖掘就像实际挖掘一样,因为矿工需要对大量材料进行筛选,并从中寻找有价值的资源和元素。
数据挖掘还包括建立关系、发现模式、发现异常、查找相关性以解决问题,以及在数据挖掘过程中创建可操作的信息。统计数据也是整个数据挖掘过程的一部分。数据挖掘有时被称为数据中的知识发现或 KDD(Knowledge Discovery in Data)。
现在,我们已经了解了什么是数据挖掘,那么我们接下来看看数据挖掘的步骤。