【白话数据分析】聊聊“大数定律”与“小数陷阱”

写在前面

很久没有更新文章了,很多粉丝也在不断地催更,之所以一直没有更新,一方面不想因为更新而更新,这样出来的内容质量也不高,另一方面,我公众号的文章都是按照系列更新的,并不是零散的知识点,这样更便于大家系统地查看,如果大家有看过,应该注意到,到目前为止,我已经更新了【初识数据分析】、【数据分析思维】、【数据分析工具】、【数据分析统计学】、【数据分析面试宝典】、【机器学习】等6个系列,所以我也一直在思考,接下来和大家聊一聊哪些话题、写哪个系列。

 

不知道大家有没有类似的经历?有没有曾经因为追求高端的算法和工具而没有及时交付最终的业务结果,最后被老板一通批评;有没有拿着一个单点的数据分析结果就给出了一个全面的结论和建议;有没有给过一些因果倒置或者“幸存者偏差”的结论,导致业务走了弯路。

 

这些经历大家多多少少都会遇到,为什么会犯这些错误?因为我们缺乏了一些基本的数据分析思维。刚好最近一直在拜读郭炜的【数据分析思维课】,讲地很好,内容深入浅出,很接地气。我们很多人缺乏的不是数据分析的理论,而是在实际场景中应用理论的能力,理论+实际场景=方法论,如何把看似浮在空中的理论落地到实际的工作场景中来,就需要通过简单易懂的案例和近似白话的语言传达出来,这也是为什么会有【白话数据分析】这个系列的原因。无论你是什么阶段什么水平,我们从生活/工作中最常见的案例出发,用最直白的文字把理论讲清楚,真正掌握数据分析的基本思维和原理,这也是写这个系列文章的初衷。

 

因为是白话,所以在这个系列文章中,没有晦涩难懂的公式和复杂的程序,我只是希望用大白话的形式,结合工作和生活中的各种各样的例子,学会怎样从数据分析的角度来解决这些问题,掌握一些数据分析最基本的知识。放我们再看待同一件事情的时候,思路和以前不一样了,可以从数据的角度来诠释身边发生的事情,用数据的思维来做出你的判断。

01 举个栗子

假如我们在澳门赌城玩最简单的轮盘赌,也就是押大小。结果连续5次都是开小,5次你都押大,所以你都输了。你觉得自己太背了,你突然想起来自己之前学过的概率论知识,轮盘赌的结果只有大/小2种可能,所以理论上大/小的概率应该是50/50,应该是均衡的。前面5次都是开小,下一次应该开大了吧,所以第6次接着押大,但还是开小,你又输了,问题出在了哪里?因为理论上长期来看出现“大”和“小”的概率应该是差不多的,如果前面开的都是“小”,所以未来出现“大”的概率应该增大,那我们接下来应该向“大”去加倍下注。这难道也错了?于是你开始怀疑人生,难道是上天注定我成不了澳门赌王?

 

还真不是,有可能你命中就是赌王,只是你缺少了点这背后的数据规律的了解。今天我们就来聊一聊这背后隐含的数据规律——“大数定律”和“赌徒谬误”。明白了这两个数据规律后,我们再遇到一些所谓的运气背或者不如意时,就能站在数据分析的角度,给出一些理性的解释和对策了。

 

02 什么是大数定律?

 

上面提到的“大数定律”,相信大家对这个概念已经不陌生了。我们在概率论当中就学过这个定律。

大数定律是由瑞士数学家雅各布·伯努利提出的,维基百科给出的定义是:概率论中讨论随机变量序列的算术平均值向随机变量各数学期望的算术平均值收敛的定律。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。偶然中包含着某种必然。

 

听不懂?不知道在讲什么?只需要记住“大数定律”的核心逻辑是说当随机事件发生的次数足够多时,发生的频率才会趋近于预期的概率。我们得玩足够多次的轮盘赌,才能预期大/小的概率分别都是50%。

 

再回到我们刚刚讨论的轮盘赌的例子,既然“大数定律”的前提是“随机事件发生的次数足够多”。那多少次才叫做“足够多”呢?这个该不会像我们中餐做菜一样,所以调料都是“适量”一样吧?

 

“足够多”在数学上叫“无穷大”,理论上就是越多越好,但实际生活中不可能出现“无穷大”。那所以在现实中,多大的数量才叫“足够大”呢?是 100 次,还是 1000 次?历史上还真有一个“无聊”的人做了这么一个实验,他就是丹麦概率论学者克里克。二战时克里克被拘留在监狱闲来无事,就做了这个一个类似的实验-抛硬币。他一共抛了 1 万次硬币,他把每次抛下来的硬币是正面还是反面做了一个统计,统计图大概就像下图的这个样子。

51da4a38e4354aa0805e1b947bf4ed88.png

 

 

从这个图中可以发现,在最开始的几百次里,抛硬币的正反面概率波动非常大,有可能会连续出现多次正面或反面的情况。到后面抛的次数越来越多,差不多到10000次左右的时候,正面和反面的概率才基本都趋向于 50%。

 

所以看了这个图可能就理解了,虽然我们在玩轮盘赌的时候,每次开大/小的概率应该各是 50%,但是我们押 100 次却不一定是 50 次大、50 小——因为玩的次数不够多,最后得出来的结果也并不够真实。换句话说,得到的结果都是各种偶然情况。

 

这时候聪明的你可能就会想了,如果是这样,那就很简单了,我只要一直玩,不停地尝试,最终肯定也不会输到哪里去,说不定还能赢一点。事实并非如此,因为相对大数定律,还有一个“小数陷阱”,它是科学家阿莫斯·特沃斯基等人在研究“赌徒谬误”时发现的。

 

03 什么是“赌徒谬误”?

 

通过前面的大数定律后,我们大概率会认为,只要玩的次数足够多,整体大/小趋势会趋向 50%-50%,如果前面开的都是“大”,那我下一次我多加注去押“小”,这样我就能在50%-50%的前提下最终赢钱了。因为理论上长期来看出现“大”和“小”的概率应该是趋于一致的,所以未来出现“小”的概率应该增大。

 

还真不是,这就是一个典型的对大数定律的误读,也就是前面我们提到的“赌徒谬误”。

 

虽然前面几轮都开“大”了,但其实后面每一次开大/小的概率还是不变的 50%,也就是说每次的事件其实和上一次的事件是独立且随机的,并不是前面都是“大”,后面开“小”的概率就会高要想赢,不能靠某一次的孤注一掷,而是长期的坚持主义,只不过很多赌徒可能还没坚持几次就已经输成穷光蛋了。所以为什么要劝大家远离赌博,你会发现真正的赌王何鸿燊发家致富靠的是他的赌场,而不是他自己在赌桌上的输赢。无论赌徒输/赢,赌场都会收取一定的费用,虽然不至于一夜暴富,但稳赚不赔,这才是真正的赌王。

 

04 如何用好大数定律?

 

那么我们如何用好大数定律?又该如何去规避赌徒谬论?今天聊的内容可以给我们一些启示。生活中有很多偶然。但也有很多必然。我们要做的就是把很多次的偶然不断重复,重复成必然。我们一直说只有坚持不懈地努力才能够成功。很多人努力了一天,没有成功就觉得这句话是错的,就不再坚持了,殊不知一天的努力只是偶然,要想成功,你可能要尝试1000次10000次,最终才有可能会成功。但是也有人会说了,我没有那么多的机会和时间,应该怎么办呢?那么这个时候我们就要站在前人的肩膀上,多去学习前辈们的经验和教训。通过书本和知识,走一遍他们走过的路。也相当于是重复了很多次的偶然,后续的尝试才会更容易成功。

 

当然你可能也听说过,有些人好像突然就成功了,甚至大肆宣扬所谓的成功论,这种现象我们要理性看待。他的可成功可能也是多次失败之后的结果,只是他展示给你的是他最终成功的一次而已。所以不要被这种现象所蒙骗。我们不要抱有侥幸心理,有这种“赌徒心态”。

 

05 总结

 

总结一下这一部分聊的内容:“大数定律”和“赌徒谬误”。

 

大数定律说的是只有当随机事件发生的次数足够多时,发生的频率才趋近于预期的概率。对于一件事情,我们需要持续不断努力,才可以达到期望值,成功只有一种定义,那就是面对每次失败后的长期主义。

 

而“赌徒谬误”则告诉我们,每个事件都是独立的事件,“否极泰来”需要足够多的次数才可能出现,做事情要少一些“赌徒心态”,多一些平常心,不要盲目跟风和下注才能获得最后的成功

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值