数据挖掘的九大定律

数据挖掘通用流程 CRISP-DM 的缔造者之一 Tom Khabaza 总结过在数据挖掘上的九大定律:

(1) Business Goals Law:每个数据挖掘解决方案的根源都是有商业目的的。

(2) Business Knowledge Law:数据挖掘过程的每一步都需要以商业信息为中心。

(3) Data Preparation Law:数据挖掘过程前期的数据准备工作要超过整个过程的一半。

(4) NFL Law:NFL 是没有免费午餐(No Free Lunch)的英文缩写。对于数据挖掘者来说,没有免费的午餐,数据挖掘的任何一个过程都是来之不易的。

(5) Watkins’Law:此定律以此命名是因为 David Watkins 第一个提出这个概念。这个定律说的是在数据的世界里,总是有模式可循的。您找不到规律不是因为规律不存在,而是因为您还没有发现它。

(6) Insight Law:数据挖掘可以把商业领域的信息放大。

(7) Prediction Law:预测可以为我们增加信息。

(8) Value Law:数据挖掘模式的精准和稳定并不决定数据挖掘过程的价值,换句话说技术手段再精妙,没有商业意义和合适的商业应用是没有价值的。

(9) Law of Change:所有的模式都会变化。

上面这九条其实归根到底就是一条,商业决定数据挖掘。数据挖掘各类技术和算法的飞速发展不能让我们偏离以商业行为为核心的方向,只是纯粹为了追求高深的技术而忽略或损害到商业目的就本末倒置了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值