二项分布(又名伯努利实验)
满足四个条件才能称为二项分布:
- 实验次数固定为n次
- 每一次实验都有两种可能结果:成功或是失败
- 而且每一次实验成功的概率都相等
- 每次实验都是独立的
例如抛硬币实验…
实验:
R语言模拟实验:
假如100位啤酒盲品者进行独立实验,每位盲品都有两种可能结果,A OR B,每位选择A的概率都相等,为50%
问题一:100位盲品者都选择B的概率为多少?
dbinom(0,100,0.5) # choose(100,0)*0.5^0*0.5^100
1] 7.888609e-31
发生概率几乎为零
问题二:有至少40位盲品者选择A的概率为多少?
> 1-pbinom(39,100,0.5)
[1] 0.9823999
问题二:有至少45位盲品者选择A的概率为多少?
> 1-pbinom(44,100,0.5)
[1] 0.8643735
从理论上讲以上的发生概率比较高,存在的风险比较小
概率虽然不会确凿的告诉我们将会发生什么,但可以通过计算知道很有可能发生什么,不太可能发生什么。
问题三:为什么是100位而不是10啤酒盲品者?
我们分别画出测试人数为10,100,1000的概率密度函数,如下图所示: