一些概率论所揭示的道理

一些概率论所揭示的道理

嗯,今天想写一点不太严肃的东西。主要原因是近日的春光很美,不想学习。
在我最初接触神经网络的时候,忘记是哪个大牛抛出了这样一个观点,神经网络想要真的模仿到人类的智慧,就一定要抛弃概率论,因为概率论永远只能描述世界的表象,不能解释世界的本质。例如,我们早期的占星学家们通过日复一日的记录,观测到月亮的周期是28天,四季的变换是365天,但是基于这样的观察记录,永远不会明白苹果会落地,与日月交替背后的本质原因。很长的时间里我一直深以为然,所以我一直不太情愿去思考概率论在神经网络中的应用。
不过最近由于我的论文也写完了,申请的留学也没有成功,所以留出了大量的咸鱼时间,让我闲极无聊的开始学习哈佛的公开课概率论(https://www.bilibili.com/video/av16160095)。一看之下,很是见猎心喜。忍不住出来吹一波。
第一个非常有趣的故事是Gambler’s Ruin Problem。假设有A和B两个赌徒,A赢得一个回合的概率为p,B赢得一个回合的概率为1-p,如果A以i个起始筹码最终赢得整个比赛的概率为Pi,B的起始资本为N-i, 在每个回合的赌注为1。A或者B 一方资产清零时,则游戏结束。
显然,这是一个零和博弈,尤其像那些以赌博成瘾,或者以炒股为发财捷径的人所面临的问题。那么这个问题最终双方赢的概率为多少呢?
P i = { ( 1 − R i ) / ( 1 − R n )   ;   R = ( 1 − p ) / p   ;   R   / =   1 ;      i / n            ;                   R = 1 P_i = \left \{ \begin{array}{c} {(1-R^i)}/{(1-R^n)} \space;\space R={(1-p)}/{p} \space;\space R \space\mathrlap{/}{=}\space 1;\\ \space \space \space \space {i}/{n} \space \space \space \space \space \space \space \space \space \space ;\space\space \space \space \space \space \space \space \space \space \space \space \space \space\space\space\space R=1\\ \end{array} \right. Pi={ (1Ri)/(1Rn) ; R=(1p)/p ; R /= 1;    i/n          ;                 R=1
证明在后面,估计没什么人有兴趣看的,这个结论告诉我们一些非常残酷的道理。

  1. 如果你是一个经常去赌场的人,并且这个赌场很公平,每一回合双方的胜率都是一样的。即使是在这样的情况下,由于一般人的赌本远没有庄家的赌本多,那么他最终会输掉的概率也远高于庄家。例如,这个赌徒很有钱,能够有赌场总赌本的九分之一,那么他最终仍然有百分之九十的概率会破产。
  2. 这个世界上,没有哪个赌场会让赌徒的预期胜率到百分之五十的,一定是低于百分之五十的,例如,抽成以及一些潜在的游戏规则约束等等。在这样的状态下,这一点微弱的劣势,在n次博弈后,会被无限的放大,以至于,即使赌徒能够有一颗见好就收的心态,也极难达到预期的目标。例如,一个人以100元为赌本,想再赢100元,每次下注1元,他每轮的胜率为0.49,他最终能达成心愿的概率也只有1.8% !
  3. 对于股票市场也是几乎一样的道理,当然有人说,因为分红的存在,股票不是零和博弈,如果你不是一个买股票吃分红的人,而是以买涨杀跌为目的,那么这就近乎是一个零和博弈了。一般散户的股本远低于庄家,那么在这场对赌的游戏中,即使庄家是一群品格高尚,不会使用一些不对称优势(例如信息不对称)的人,散户的赢面仍然是极低的,因为这个世界上懂得见好就收,适可而止的人实在是太少了。

如果上面的例子还不能让人断了这些赌博心理,那么下面这个问题就更能让人窒息:
瓮模型(Urn model)
人类有一种模仿本能,有人称之为meme,固然这是人类能够具有卓越的学习能力以及社会群体存在的基础,但这种模仿本能常常被一些要么无知要么心怀恶意的人通过一些巧妙的方法掩盖它的缺陷,比如,标榜人性的自由或者强调人类的智慧的伟大。这种模仿本能的一个巨大的缺点之一,在于从众心理,以及对于信息下意识的不经思考的接受。
瓮模型说的是,一个瓮里面有红球也有黑球,当人们摸出一个球以后,便会再放入两个一样颜色的球。比如,本来有n个红球和m个黑球,第一轮摸出一个红球,再放入两个红球,则瓮中现在有n+2个红球和m个黑球。这就是一个数学语言表达的跟风模仿行为。
那么这个模型的结果是什么呢?这里是一份blog(http://blog.sina.com.cn/s/blog_562a1ba00100zhze.html) (抱歉我已经找不到原始的出处了)的原话:
在这个实验最开始的时候,所有的可能性都是并存的。进程开始时,最初拿出来的黑白球比例完全是随机的。加入同颜色的球是一种模仿行为,具有正反馈的效果。随着进程的演变,这种正反馈,逐渐强化并固化了最初的随机状态,把进程变成了一个不可逆过程,最终进入稳定状态。最后,一个颜色的球占总数的比例可以是0和100%之间的任意一个数。
在股票市场,相互模仿造成的羊群效应非常明显。资产价格就是非常明显的信号,其变化能影响众多模仿者的行为。当股市正常时,市场参与者意见迥异,有买有买,形成市场的正常流动。这种内在的平衡机制类似于负反馈,让股市围绕基本面上下波动,但最终仍然追寻基本面发展的方向。由于影响股市的诸多因素是随机的,股市的变化也是随机的,股市无法预测。而当股市的变化(如超指数的增长/下跌)触发了模仿者的正反馈行为,则随机的变化被正反馈所强化,股市就进入了受羊群效应驱动的模式。这时候,股价可能背离基本面很远,而且保持很长的时间。这就是凯恩斯所说的“市场能保持非理性很长时间,长到超过你能保持偿付能力而不破产的时间。” 这时候的市场不再有效,市场的行为虽然疯狂,但变得可以预测。
研究表明,股市仅在约2.5%的时间里处于无效的泡沫状态。而泡沫,尤其是上涨型泡沫的形成、发展、成熟、破灭并不是一个转瞬即逝的短暂过程。比如著名的1987年股灾其实就是一个资产泡沫的剧烈破灭,而这个泡沫的最初形成要追溯到1983年底,1984年初。这个影响深远的资产泡沫,其形成、发展、成熟、破灭的过程历时三年十个月。在这段时间里,市场参与者的模仿行为形成了资产价格的正反馈,把最初的随机状态强化、固化,直到走向泡沫不可避免的最终命运----破灭。
一个社会的演变也许有点类似瓮模型。人类文明的发展传承,很大一部分来自于模仿。社会演变的早期,很多状况是随机的,未来发展的所有可能性都是并存的。由于社会自身存在大量的模仿行为,逐渐对最初的随机状态进行强化、固化。而一旦某个随机状态被固定下来,其它所有的可能性就会消失。想要改变固有的状态非常困难,几乎是不可能的。这时候的系统走向是可以预测的,其命运已经注定。只有当系统重置,所有的可能才会重新出现。这就如同《泰坦尼克》的导演詹姆斯·卡梅隆所说的,泰坦尼克是关于人类傲慢与自大的寓言。巨型的机器,人类创造的系统,以无比巨大的势头向前冲,已经无法转弯,无法停止,也就无法避免灾难。我们已经看到冰山,但我们无能为力。我们无法转弯是由于系统的惯性,政治上的,商业上的。太多人从这个系统中赚钱,他们有权有势,他们不想放弃。直到我们的生命真正处于危险之中,我们才会知道大家真实的反应。

好了,可以关掉这个页面了;
Gambler’s Ruin Problem 证明:
P i = P ( A   w i n s   t h e   g a m e   ∣   A   s t a r t   a t   i ) P_i = P(A \space wins\space the\space game\space | \space A \space start\space at\space i) Pi=P(A wins the game  A start at i)
因为在i位置有p的概率到i+1位置,或者1-p的概率到i-1位置,所以有:
P i = p P i + 1 + ( 1 − p ) P i − 1 P 0 = 0   ;   P n = 1 R = ( 1 − p ) / p P_i = pP_{i+1}+(1-p)P_{i-1}\\ P_0 = 0 \space; \space P_n = 1\\ R=(1-p)/p Pi=pPi+1+(1p)Pi1P

  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值