若干年前,当笔者还在本科时就听说过一个经典案例:研究者发现将啤酒和尿片放在超市中同一地方销售,啤酒的销量能得到极大的提升。

这可能是笔者听到的关于数据分析与数据挖掘的最神乎其神的案例了。在此之后,笔者对数据分析的作用叹为观止。

两年前,笔者在INTEL时,曾经做过一项商业智能(BI)方面的市场研究。彼时,商业智能正作为IT领域未来的发展趋势,大为火热。IBM和甲骨文都新近并购了两个专门做BI的公司,以此来充实自己的实力,Business Objects, SPSS, Teradata, SAS等专业BI公司也磨刀霍霍,国内的BI企业虽然只能做最简单的报表展示,却也摇起呐鼓蠢蠢欲动。通过那各研究,笔者对整个BI系统的精细构造、科学计算等极为相信。

但最近一位朋友对我述说的他的经历,却让我对数据分析的信心大打折扣了。

该朋友在一国有企业省分公司工作,总部要求各省上报经营数据,由于某项数据涉及到其他业务部门,于是朋友从其他部门取得相应数据并上报总部,但后来总公司发现该数据异常并询问朋友,朋友便询问数据提供部门,答曰我们虽然有这数据,但我们并不考核该数据,所以我们不关心该数据,其是否准确也不关心,相信就报;我这个朋友是个新兵蛋子,做事很认真,于是再询问IT部,答曰,数据没错;于是再询问另一部门,得到了另一个更为合理的数据;此时,致电总部修改数据,总部说,数据已经交给领导了,不能修改了,就这样了。可在第二天的分析会议上,领导基于该数据点名批评了该省公司业务出现问题,并说的头头是道、有理有据。

朋友向我抱怨,忙碌了一整天为了这个数据跟各个部门周旋,到处碰灰,到头来却用的还是错误的数据,还被基于这个数据点名批评,实在是哭笑不得,无语至极。

不少外国经济学家怀疑中国的GDP,说中国的GDP就像挤满水的泡沫,社会上也流行着这样一句话,“村骗乡,乡骗县,一直骗到×××”。无论是政府单位还是大型企业,这种一级骗一级,虚报数据、谎报数据、对数据不负责任的现象都层出不穷。

任何一个标榜为现代管理企业的公司管理层,却都知道数据的水分有多大,不可靠程度有多大,然而,即便如此,管理者们还是要基于此数据作出重大决策,并信誓旦旦的让自己相信也让别人相信自己的决策是有理有据、科学准确的。呜呼哀哉!笔者不禁感叹,再严密的科学计算方式,可能也比不上管理者的自欺欺人的经验主义与拍脑袋精神。更何况,数据还是为人服务的,只要管理者需要,自然有下属们变着花样,或是分解,或是合并,或是修改口径,获得其想要的数据呢。呜呼哀哉!

基于正确的数据作出正确的决策是一门科学,基于错误的数据作出自以为正确的决策则是一门艺术。但,这样的艺术,不要也罢了吧。