目录导引
这一个系列的笔记和整理希望可以帮助到正在学习非参数统计的同学。我会慢慢更新各个章节的内容。
3 两独立样本数据的位置和尺度推断
第二章我们主要考虑的是单一样本所属总体的推断,如总体位置估计。这一章是关于两个不同样本所属总体的位置参数或者尺度参数对比。
一般性的,
X 1 , X 2 , . . . , X m ∼ i . i . d . F 1 ( x − μ 1 σ 1 ) , Y 1 , Y 2 , . . . , Y n ∼ i . i . d . F 1 ( x − μ 2 σ 2 ) X_1,X_2,...,X_m \stackrel{i.i.d.}{\sim} F_1(\frac{x-\mu_1}{\sigma_1}),Y_1,Y_2,...,Y_n \stackrel{i.i.d.}{\sim} F_1(\frac{x-\mu_2}{\sigma_2}) X1,X2,...,Xm∼i.i.d.F1(σ1x−μ1),Y1,Y2,...,Yn∼i.i.d.F1(σ2x−μ2)
在只考虑位置参数问题的时候可以简化为
X 1 , X 2 , . . . , X m ∼ i . i . d . F ( x ) , Y 1 , Y 2 , . . . , Y n ∼ i . i . d . F ( x − μ ) X_1,X_2,...,X_m \stackrel{i.i.d.}{\sim} F(x),Y_1,Y_2,...,Y_n \stackrel{i.i.d.}{\sim} F(x-\mu) X1,X2,...,Xm∼i.i.d.F(x),Y1,Y2,...,Yn∼i.i.d.F(x−μ)
关于位置参数的检验问题是
H 0 : μ = 0 ↔ H 1 : μ ≠ 0 H_0: \mu=0\leftrightarrow H_1:\mu \neq 0 H0:μ=0↔H1:μ=0
这实际上可以理解为两个样本的中位数位置比较。3.1-3.2
讨论这一问题
致于尺度参数问题,
H 0 : σ 1 = σ 2 ↔ H 1 : σ 1 ≠ σ 2 H_0: \sigma_1=\sigma_2 \leftrightarrow H_1:\sigma_1\neq \sigma_2 H0:σ1=σ2↔H1:σ1=σ2
3.3-3.4
讨论这一问题
3.1 Brown-Mood 中位数检验
H 0 : m e d X = m e d Y ↔ H 1 : m e d X ≠ m e d Y H_0: med_X=med_Y \leftrightarrow H_1:med_X \neq med_Y H0:medX=medY↔H1:medX=medY
如果 H 0 H_0 H0成立,两样本的混合中位数 m e d X Y med_{XY} medXY也可以均匀地分隔开 { X i } i = 1 m , { Y i } i = 1 n \{X_i\}_{i=1}^m, \{Y_i\}_{i=1}^n {
Xi}i=1m,{
Yi}i=1n两组样本。
检验关注 A A A的数值, A A A的意义是 { X i } i = 1 m \{X_i\}_{i=1}^m { Xi}i=1m在混合中位数右侧的个数,
- 如果 A A A很大,表示 { X i } i = 1 m \{X_i\}_{i=1}^m { Xi}i=1m的中位数明显大于 { Y i } i = 1 n \{Y_i\}_{i=1}^n { Yi}i=1n的,
- 如果 A A A很小,表示 { Y i } i = 1 n \{Y_i\}_{i=1}^n { Yi}i=1n的中位数显著大于 { X i } i = 1 m \{X_i\}_{i=1}^m { Xi}i=1m的。
3.1.1 精确分布
先补齐一个列联表,明确符号
X | Y | sum | |
---|---|---|---|
> M X Y >M_{XY} >MXY | A | B | t |
< M X Y <M_{XY} <MXY | C | D | (m+n)-(A+B) |
sum | m | n | m+n |
原假设成立条件下, A A A服从超几何分布,精确概率如下
P ( A = k ) = ( m k ) 0. 5 m ( n t − k ) 0. 5 n ( m + n t ) 0. 5 m + n = ( m k ) ( n t − k ) ( m + n t ) P(A=k)=\frac{\tbinom{m}{k}0.5^{m} \tbinom{n}{t-k}0.5^{n}}{\tbinom{m+n}{t}0.5^{m+n}} = \frac{\tbinom{m}{k} \tbinom{n}{t-k}}{\tbinom{m+n}{t}} P(A=k)=(tm+n)0.5m+n(km)0.5m(t−kn)0.5n=(tm+n)(km)(t−kn)
其分母表示从 m + n m+n m+n个数中一共选了 t t t个放在混合中位数的右侧,着 t t t个的成份显然是分为从 m m m个 X i X_i Xi中选 k k k个, n n n个 Y i Y_i Yi<