数据挖掘更在乎成本与收益

统计分析一般都是验证性分析

数据分析中,不管是数据挖掘领域还是统计分析领域,都较为侧重验证性,验证性分析占据非常重要的主导地位。不同的是,99%的统计分析都是验证性分析,而数据挖掘领域中验证性分析的比例略低,能达到80%-90%左右。

实际业务中用什么去主导分析?

实际工作中,当面临一个庞大的数据库时,用什么方法去主导自己的分析呢?如果仅仅针对业务痛点进行分析,这样的思路没错,但是很快会发现,这样会导致整个分析进入死胡同,并且一段时间后,大部分的数据分析工作都在做重复的分析内容,因此对商业的支撑便会出问题。此时需要反思数据分析是否有框架的指导,如果有框架的指导,还需要结合4P理论、4C理论以及客户关系理论等。

如果不了解验证分析背后框架或理论,则可以参考同行业中的相似框架。

数据挖掘不强调精度

不同的数据分析领域量化的方式不同,传统分析中更为关注精确性,如果指标做不到精确,则业务人员会对模型的分析结果产生质疑,尤其是问卷行业,对精度的要求更高。

然而,数据挖掘领域,精度似乎没有那么重要,我更加关注指标的可解释性以及模型与业务之间的契合性。

不同场景下数据挖掘的含义不同

计算机模型、统计模型与数据挖掘模型处理问题的出发点完全不同,例如什么是大数据这个问题,不同场景下的含义是不同的:

实验室场景中,由于场景样本量较小,样本获取不易,因此对数据精确度要求较高,30个左右样本量即为大数据。;

市场分析中,样本量200左右即为大数据;

数据挖掘领域中,通常以100万为界进行大数据的区分。

因此,提到大数据时首先要清楚场景,否则很难将数据精确度、数据以及商业价值更好的契合起来。

数据挖掘不太关心因果

通常,统计分析侧重于模型的因果,然而,商业价值中,因果关系并不是那么重要,探究结果只会带来成本的上升,因此数据挖掘模型不太关注因果,数据挖掘领域更为关注成本与收益。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值