国际惯例,先看几个例子:
- 假设抛硬币,抛了12次,出现正面为1,反面为0,如果出现正面的次数为10次,问这个硬币是否均匀?
- 假设有一个正四面体,出现四个面的分别记为1,2,3,4;抛了120次,如果出现这四个面的次数为30,30,40,20的话,问这个四面体是否均匀?
- 假设有一个灌铅的正四面体(赌博用),厂商声称其中出现4的概率为70%,其他三个面为10%,那么抛了120次,四个面的概率为(1,2,3,4)为10,10,20,80,问这个四面体合不合规?
- 假设赌博的时候,用两个之间连根线的硬币A和B(不一定是均匀硬币),出现正面为1,反面为0,一共抛了120次,A出现100次正面,B出现90次正面,问这个绳子是否对两个硬币的分布造成影响?
- 在赌博的时候用之前的正四面体(不一定是均匀四面体),并用线连接起来,一共抛120次,两个四面体A和B出现(1-4)点数的次数为A:20,20,40,40;B:30,20,30,40 问这个两个四面体的分布是否独立?
- 在一个大风天里玩三个骰子(-_-),抛了A四面体骰子12次,B抛了24次,C抛了32次,A出现的四个面为(3,3,3,3),B为(6,7,5,6),C为(8,8,6,7),问这三个筛子的分布是否相互独立?
- 如果刚开始是一个四面体骰子,扔了100次,出现1234的次数别是20,20,25,35;后来厂商进行改进说能扔出更多的4,扔了200次,发现出来1234的次数为10,20,30,140,问:
1:第一个骰子是均匀分布的么?
2:第二个骰子真的和第一个不一样么?
3:第二个筛子出现4的概率真的比第一个大么?
以下是问题的解答,其中统一取p=0.01,也就是小于1%的话,认为事件不可能发生
1:p=C(12)(10)* (1/2)^10*(1/2)^2=0.016;
也就是说有1.6%的概率发生这件事情,既然我们之前取得概率是1%,所以可以接受这个巧合
2: 最简单的卡方检验
x2<-c(30,30,40,20)
p2<-rep(0.25,4)
chisq.test(x2,p=p2)
pvalue=0.08,无法拒绝原假设,也就是有8%的概率出现以上的情况。
3:一维卡方
p3<-c(0.1,0.1,0.1,0.7)
x3<-c(10,10,20,80)
chisq.test(x3,p=p3)
#结果:
Chi-squared test for given probabilities
data: x3
X-squared = 6.1905, df = 3, p-value = 0.1027