概率论的学习和整理8：几何分布

总结下，在N次伯努利试验（只有2种结果且概率稳定）中，首次成功的次数ξ（ξ这个变量对应的不是1个数，而其实是1个次数序列）这个变量的概率符合几何分布。

因为试验次数1-n 变化时，变量ξ的概率和期望都不同，是存储在ξ内的一个序列

这个变量ξ的概率函数p（其实是pdf 不只是1个具体p），符合几何分布

这个变量ξ，随着1~n变化 ξ(1~n) 他各个可能的值全拿出来算一个平均次数，也就是期望

这个变量ξ 的各个值和平均值的差距的平方之和是方差

4 为什么叫几何分布（几何=等比）

几何关系可以简单理解为等比
几何分布 P(ξ=k)=(1-p)^(k-1) *p
就是因为分布的各项，都是等比数列！
就是因为分布的各项，中间项都是前后两项的几何平均数，所以叫几何分布！

4.1 先需要了解算术平均数和几何平均数

首先要了解
a和b的算术平均数是 (a+b)/2
a和b的几何平均数 (a*b)^-2 或者说 √ab

4.2 第1：几何布分布的，各个项之间，就是等比数据，公比为 (1-p )

几何分布 P(ξ=k)=(1-p)^(k-1) *p
p*(1-p)，p*(1-p)^2 ，p*(1-p)^3
公比都是 (1-p)

4.3 第2：几何布分布每个中间的项，都是前后两个数的几何平均数，因此得名

几何布分布的，每个中间的项，都是前后两个数的几何平均数
因此叫做几何分布
p*(1-p)，p*(1-p)^2 ，p*(1-p)^3
p*(1-p)*p*(1-p)^3 =p^2*(1-p)^4 = (p*(1-p)^2 )^2

5 几何分布的期望

一般意义的几何分布所说的期望，默认是指，几何期望的定义：伯努利试验，最后一次成功，成功次数n对应的随机变量的期望。
而实际上，也可以在二项分布下其他随机变量的数学期望，比如，失败次数m (m=n-1)的数学期望，
这个期望显然和n的数学期望是不同的！

5.1 符合几何分布的变量，其期望

如果我们定义的随机变量是 n
n 表示n次伯努利试验，最后1次成功这个变量
成功概率为p
那么，n的数学期望 E(n) =1/p

前提不变，都是成功概率为p
考察n ，第n次成功			求期望 E(n) = limξ 乘积
总次数	n次数取值	概率	乘积=期望展开项
	随机变量n		E(n)=1/P
1	1	p	1*p
2	2	(1-p)*p	2(1-p)p
3	3	(1-p)^2*p	3(1-p)^2p
…	…	…	…
n	n	(1-p)^(n-1)*p	n(1-p)^(n-1)p

下面是推导过程

5.2 几何分布，其中失败次数 m的期望

如果我们定义的随机变量是 n
n 表示n次伯努利试验，最后1次成功，那么失败次数为m , m=n-1
成功概率为p ，失败概率是1-p
那么，失败次数m的数学期望 E(m) =(1-p)/p

前提不变，都是成功概率为p
考察m=n-1 失败的总次数			求期望 E(n) = limξ 乘积
总次数	m=次数取值	概率	乘积=期望展开项
	随机变量m		E(m)=(1-P)/P
1	0	(1-p)^0*1	0(1-p)^01
2	1	(1-p)^1*p	1(1-p)^1p
3	2	(1-p)^2*p	2(1-p)^2p
4	3	(1-p)^3*p	3(1-p)^3p
…	…	…	…
n	n-1	(1-p)^(n-1)*p	n-1(1-p)^(n-1)p

下面是推导过程

6 几何分布的方差

几何分布的方差，第n次成功，n的方差为 (1-p)/p^2

推导过程暂缺

7 几何分布的概率分布：分布率，分布函数，分布图

默认集合分布的随机变量，都是指最后一次成功的次数n 所对应的随机变量
如果要求几何分布的失败次数m (m=n-1) 一般需要单独指明

7.1 几何分布的分布律

几何分布的概率分布率是
可以如下表格表示

7.2 几何分布的概率分布函数

因为这个有通项
所以概率分布函数比较简洁
p(n) = p*(1-p)^(n-1)

7.3 几何分布的概率分布图形

pdf，P(ξ=k)=(1-p)^(k-1) *p 根据公式特点 p>=0 and p<=1 ，随着k变大，p(ξ=k)必然越来越小，所以集合分布的pdf一定是单调递减的
cdf，必然是单调递增的，因为p>=0的，累计p必然递增

8 几何分布的期望的图形（一般很少画期望的图形）

几何分布的期望公式
E(n)= n*p*(1-p)^(n-1)
可见，几何分布，当概率p 越小，总期望最后1次成功的概率，则n会越大
比如概率 0.8的时候，期望1.25次就可以成功
而概率为0.2的时候，期望5次才可以成功
符合直觉
另外，其实假设试验次数无限次，期望次数= 1/P , 符合这样的规律？
每个方框内，第一个是期望概率，后2个不是期望，而是每个期望组成部分的变化，没啥意义的
期望=第2列的sum = 第3列的max

下图
左1是，期望的每个项的数值的图示
左2是，累计的前面部分期望项的和，逐渐接近整体的期望，模拟近似期望E(n)

9 具体例子：几何分布的概率，平均值，方差的多种计算对比

9.1 几何分布的一个计算例子如下

基础试验的情况

基础实验只有0，1 两种结果
基础实验，结果为1/成功的概率为0.1 ，失败概率=1-0.1=0.9
且进行n次试验，基础试验的概率都是稳定不变的

9.2 符合几何分布的随机变量n 的概率P(n=i)分布函数Pdf

9.2.1 注意Pi 和p的区别

概率，一个是p 一个是Pi
注意 p 是单次基础实验的概率，基础试验只有0，1两种结果，且概率不变，p成功=0.1不变。
而Pi 是(最后1次成功的次数)随机变量n的概率,而 Pdf是pi的集合，用函数表示的。

9.2.2 随机变量n的Pi概率公式

几何分布的概率公式，Pdf=P(n=i)=(1-p)^(n-1)*p
概率公式直接用乘法原则推导
失败 n-1次，成功1次= (1-p)*(1-p)*.....(1-p)*p=(1-p)^(n-1)*p

9.2.3 Pi概率对应的pdf 和cdf的分布曲线形态

cdf的Y轴在左边
pdf的Y轴在右边
并且概率分布必须符合 Σpdf=1 ，从公式给 pdf求和也可以得到 Σpdf=1
图形上可以看出来，cdf 趋向1

从公式给 pdf求和也可以得到 Σpdf=1

9.3 符合几何分布的随机变量n 的均值/期望值

符合几何分布的变量的期望 E(n)=1/p =1/0.1=10
由于 n是一个随机变量，其实n只能有期望值，而不能是平均值！因为n的值是变化的，不同的n值对应不同的概率，而平均值一般是指所有结果都知道。
随机变量n的期望值，也可以称为概率加权平均值吧
朴素/通用的随机变量期望值公式 E(n)=P1*1+P2*2+....+Pn*n= Σ pi*ni
求期望通用公式的概率是P，是每个随机变量n=1,2,3...n对应的那个Pi
图上符号用的不严谨不对，按文字里我写的为准。图上只看计算过程。

期望的累计值的Y轴在左边，趋近的值就是期望值
期望值的Y轴在右边，蓝色线
在期望值附近，期望值变化曲线到了最高值，也就是期望值得曲线的最高点---对应着期望值E(n)=10

9.4 符合几何分布的随机变量n 的方差

X^2 列就是期望变量次数k的平方，也可以写成 k^2
而 E(X^2) =Σ Pi* ki

可以看到3种计算方差方法算出结果都一样
符合几何分布的方差公式 D(n)=(1-p)/p^2
朴素的计算方差公式有如下两种
D(n)=Σpi*(ni-E(n))^2
D(n)=E(n^2)-E(n)^2

方差算法2： D(n)=ΣPi*(ni-E(n))^2
其中随机变量D(n)=ΣPi*(ni-E(n))^2 计算要注意 (是Pi 而不是p)
如果不是随机变量则相当于已经知道了所有结果，求所有结果/已知信息的方差
D(n)=Σ(ni-E(n))^2 /n
其中，抽样调查时，样本方差就是这个公式，或者事先给出的一些样本也用这个公式，因为我们不知道真实概率/只能推测符合均匀分布/或者假设符合均匀分布，其实1/n 就相当于概率 Pi

方差算法3

D(n)=E(n^2)-E(n)^2

注意，先计算一个新列 n^2

然后新列每行分别等于 P1*1^2 ， p2*2^2， ...， Pn*n^2

然后E(n^2) =P1*1^2+p2*2^2+ ....+Pn*n^2 = Σ Pi*n^2

然后D(n)=E(n^2)-E(n)^2