Content: 1.The Birthday Paradox
2.Bails into Bins
3.The Poisson Distribution
4.Random Graphs
1.生日悖论:
问题1:在同一间房子中,有两个人存在同一天生日的概率大还是没有人存在同一天生日的概率大?
(在这篇文章中由于公式计算量大,具体的一些计算公式我会通过把我的笔记用照片的方式来上传阅读)
在我上传的图片中可以看到,当我们假设这个屋子中的人数N=30时,可以通过法一和法二来解除当30个人在同一屋子中的概率,我们假设这一年有365天,其中一个人生日是1/365,而我们选的这一天恰巧不是某位同学生日的那一天,那我们得出的概率就为(1-1/365)。同理可推出第三位同学,第四位同学直到第三十位同学。我们所求得的概率约为0.2937。所以我们可以说当一间屋子有30个人时,有超过70%的概率有两位以上的同学存在生日重复。
用数学概率的角度来看这个问题我们可以发现,假设有m个人有n个可能的生日,我们就可以把概率公式化如上图给出的公式,使用泰勒公式将其化简后我们可以得出最后结果。
假设我们要求有50%的可能性是同一天生日和不同一天生日的概率。那么我们通过上述公式可以解出:当n=365 时 m=22.49。我们就可以说当有23个人在同一间房子中,有50%的几率有/没有两个人在/不在同一天生日。
如果令Ek位第k个人生日与前面第k-1人中的每一个人的生日都不同的事件。那通过下图笔记可以看到人数与概率的关系。
2.The Balls And Bins Model
问题:将m个球等概率的扔在n个箱子中,球在箱子同的分布的个数是怎样的呢?(与生日悖论模型相同)这时我们就回考虑到是否有一个箱子存在多于一个球的数量呢。我们可以得到引理5.1:如图所示。
最大负荷也就是说一个箱子中最多大于3lnn/lnlnn数量的概率至多为1/n。下图为具体的证明。
首先我们确定是n个球均匀的放在n个箱子中的。而最大负荷为m个球,所以bin1<=上图式子。(从n个中选m个,每一个的概率为1/n,又有m个球)然后我们通过具体的化简可以得出它的一个上界1/M!。
在确定了上界后,我们来继续确定它的下界,它的下界有两种方法:
此处我们可以直接运用方法二近似计算的公式来进行判断,我们可以解得它的上下界,然后当M=3lnn/lnlnn时代入公式可以解得<=1/n。
3.The poisson Distribution
这一部分我们首先来介绍什么是泊松分布和泊松分布的均值。具体如下图笔记:
接下来就是泊松分布的性质,两个独立的泊松分布之和也是泊松分布。具体的内容如笔记所示:
接下来,我们将介绍泊松随机变量的矩函数证明:
我们利用了泊松分布的概率之和为1 的性质进行了凑整。可以得出泊松分布的矩函数。并且和的矩函数等于矩函数的积。
接下来,我们要给出泊松分布随机变量的切诺夫界,后面将会用到。
具体的证明思路和我上一次提到的伯努利的切诺夫界证明方法相同:先对函数指数化,然后进行马尔可夫不等式化简,然后利用期望算出矩函数代入,然后当t=特殊值ln(x/u)可以得到最后切诺夫界的上界。
三、四的方法与伯努利试验的切诺夫界证明方法相同,请读者自行证明。
4.Limit of the Binomial Distribution(二项分布的极限)
接下来我们将证明这个定理。如果有n个事件有k个发生且发生的概率为P,那么我们就可以得到从n个里面选k个的二项分布函数。我们将这个式子展开后得到:
通过利用泰勒公式我们可以化简到如上图结果所示。我们就得出来它的一个上界。我们通过上述总结引入了下图中右边的定理:
具体左侧红笔标注的地方我没有想明白是怎么化简的,如果有算出来的请私聊告知,谢谢。
综上所述,我们就得到了他的一个上界一个下界。当lim—0时np=拉姆达。所以解得如下:
所以这个定理成立。
5.Random Graphs
这里我吗所介绍的为两种随机图的模型,介绍随机图的单调递增和单调递减。具体如下图笔记所示:
——————————————————————————————————————————————————————————
具体分享结束,其中不足之处希望读者私信告知,谢谢。