Stratification Randomized Experiments (SRE)
Definition: We conduct K K K independent CREs within the K strata of a discrete covariate X X X.
【分层标准:离散协变量 X X X】
提出SRE的原因:
CRE wtih 离散协变量 X ∈ { 1 , … , K } X\in\{1,\ldots,K\} X∈{1,…,K},定义
- n [ k ] 1 = # { i : X i = k , D i = 1 } n_{[k]1} = \#\{i : X_i = k, D_i = 1 \} n[k]1=#{i:Xi=k,Di=1}: X i = k X_i = k Xi=k的个体里接受治疗的
- n [ k ] 0 = # { i : X i = k , D i = 0 } n_{[k]0} = \#\{i : X_i = k, D_i = 0 \} n[k]0=#{i:Xi=k,Di=0}: X i = k X_i = k Xi=k的个体里对照组的
【问题在于:对于不同的
k
k
k而言,可以
k
k
k组内的所有个体都没治疗或者治疗了,这样covariate就不balance了,会导致
n
[
k
]
1
n
1
−
n
[
k
]
0
n
0
\frac{n_{[k]1} }{n_1} -\frac{n_{[k]0} }{n_0}
n1n[k]1−n0n[k]0差的特别大,因为有的
n
[
k
]
1
n_{[k]1}
n[k]1或者
n
[
k
]
0
n_{[k]0}
n[k]0可以为0.】
???为啥要算这个?因为要在每个层内算
E
{
Y
(
1
)
−
Y
(
0
)
}
E\{Y(1)-Y(0)\}
E{Y(1)−Y(0)},所以要✖️在这个层里的
D
=
1
D=1
D=1 or
0
0
0的概率??
那咋整,那就提前固定 n [ k ] 1 n_{[k]1} n[k]1或者 n [ k ] 0 n_{[k]0} n[k]0,让它不是0就行了
定义within stratum k, the proportion of units receiving the treatment is 治疗比例
e
[
k
]
=
n
[
k
]
1
n
[
k
]
e_{[k]} = \frac{n_{[k]1}}{n_{[k]}}
e[k]=n[k]n[k]1
也叫倾向得分(propensity score)
于是,SRE和CRE的区别就是:SRE的 e [ k ] e_{[k]} e[k]提前固定,但CRE的 e [ k ] e_{[k]} e[k]是随机的。
分层ACE
For stratum
k
k
k, we have stratum-specific average causal effect
τ
[
k
]
=
n
[
k
]
−
1
∑
i
:
X
i
=
k
τ
i
\tau_{[k]} = n_{[k]}^{-1}\sum_{i:X_i = k}\tau_i
τ[k]=n[k]−1i:Xi=k∑τi
故ACE为
τ
=
n
−
1
∑
i
=
1
n
τ
i
=
n
−
1
∑
k
=
1
K
∑
i
:
X
i
=
k
τ
i
=
n
−
1
∑
k
=
1
K
n
[
k
]
τ
[
k
]
=
∑
k
=
1
K
n
[
k
]
n
τ
[
k
]
:
=
∑
k
=
1
K
π
[
k
]
τ
[
k
]
\tau = n^{-1}\sum_{i=1}^{n}\tau_i = n^{-1} \sum_{k=1}^{K} \sum_{i: X_i = k} \tau_i \\= n^{-1} \sum_{k=1}^{K} n_{[k]}\tau_{[k]} = \sum_{k=1}^{K} \frac{n_{[k]}}{n}\tau_{[k]}\\ := \sum_{k=1}^{K} \pi_{[k]}\tau_{[k]}
τ=n−1i=1∑nτi=n−1k=1∑Ki:Xi=k∑τi=n−1k=1∑Kn[k]τ[k]=k=1∑Knn[k]τ[k]:=k=1∑Kπ[k]τ[k]
π
[
k
]
=
n
[
k
]
n
\pi_{[k]} = \frac{n_{[k]}}{n}
π[k]=nn[k]: proportion of units in stratum
k
k
k
e
[
k
]
=
n
[
k
]
1
n
[
k
]
e_{[k]} = \frac{n_{[k]1}}{n_{[k]}}
e[k]=n[k]n[k]1: propensity score in stratum
k
k
k
感兴趣的是 τ \tau τ
τ
k
\tau_k
τk可以用前面的FRT和Neyman’s estimator之类的推断,
τ
\tau
τ有类似的FRT和Neymanian inference,就是要考虑
π
[
k
]
\pi_{[k]}
π[k]进去
【写这个主要是为了后面看propensity score时候用,
因为,记倾向得分为
e
(
X
)
e(X)
e(X),Theorem 11.1得到
在strong ignorability 下,有
if D ⊥ { Y ( 1 ) , Y ( 0 ) } ∣ X D \bot \{Y(1), Y(0)\}|X D⊥{Y(1),Y(0)}∣X$, then D ⊥ { Y ( 1 ) , Y ( 0 ) } ∣ e ( X ) D \bot \{Y(1), Y(0)\}|e(X) D⊥{Y(1),Y(0)}∣e(X)
那么如果 e ( X ) e(X) e(X)已知且离散的话,其实可以将总体按照 e ( X ) = e 1 , … , e K e(X) = e_{1},\ldots,e_{K} e(X)=e1,…,eK去分层考虑,这样问题就转换成了SRE。】