一个Bin的信号强度上限的假设检验上
一个Bin的信号强度上限的假设检验
如有错误,欢迎指正!
问题
给定预计的信号个数
S
S
S,本底个数
B
B
B,求出给定数据
N
o
b
s
N_{obs}
Nobs下,信号强度
μ
\mu
μ的上限.
解释:
一个Bin内真实情况应该有
μ
S
+
B
\mu S+B
μS+B个,数据
N
e
x
p
N_{exp}
Nexp应该服从以
μ
S
+
B
\mu S+B
μS+B为均值,标准差
μ
S
+
B
\sqrt{\mu S+B}
μS+B的泊松分布.但是实际数据
N
o
b
s
N_{obs}
Nobs可能产生了一个值,通过泊松分布来就可以判断哪些
μ
\mu
μ值是不可能的。
泊松分布的概率密度函数为:
f
(
n
∣
λ
)
=
λ
n
e
−
λ
n
!
f(n|\lambda)=\frac{\lambda^ne^{-\lambda}}{n!}
f(n∣λ)=n!λne−λ
泊松分布的期望值为
λ
\lambda
λ,标准差为
λ
\sqrt{\lambda}
λ.
例如:
假设有一组数据
N
o
b
s
=
10
N_{obs}=10
Nobs=10,预计的(或者说模型的)信号个数
S
=
4
S=4
S=4,本底个数
B
=
5
B=5
B=5,显然当
μ
=
=
2.5
\mu==2.5
μ==2.5的时候,
f
(
10
∣
2.5
∗
4
+
5
)
=
λ
n
e
−
λ
n
!
=
0.0486
f(10|2.5*4+5)=\frac{\lambda^ne^{-\lambda}}{n!}=0.0486
f(10∣2.5∗4+5)=n!λne−λ=0.0486
这个概率很小说明
μ
\mu
μ不太可能在这个值。扫描
f
(
10
∣
μ
∗
4
+
5
)
>
0.05
f(10|\mu*4+5)>0.05
f(10∣μ∗4+5)>0.05就可以得到一个
μ
\mu
μ的区间.但是这个检验方法足够好吗?后面将用假设检验来获得上限。
理论
最大似然函数
实际判选会更加复杂,不过基本结论是一致的,判断在这个
μ
\mu
μ时的发生的概率应该大于0.05.(正常说法是[拒绝
μ
\mu
μ当在此
μ
\mu
μ时给定数据发生的概率小于0.05])
实际中往往用最大似然函数来描述这个概率
L
(
μ
;
Θ
)
=
L
e
l
s
e
(
μ
;
Θ
)
∏
B
i
n
=
1
N
B
i
n
(
μ
S
(
Θ
)
+
B
(
Θ
)
)
n
i
,
o
b
s
e
−
μ
S
(
Θ
)
−
B
(
Θ
)
n
i
,
o
b
s
!
L(\mu;\Theta)=L_{else}(\mu;\Theta)\prod_{Bin=1}^{N_{Bin}}\frac{(\mu S(\Theta)+B(\Theta))^{n_{i,obs}}e^{-\mu S(\Theta)-B(\Theta)}}{n_{i,obs}!}
L(μ;Θ)=Lelse(μ;Θ)Bin=1∏NBinni,obs!(μS(Θ)+B(Θ))ni,obse−μS(Θ)−B(Θ)
其中
μ
,
Θ
\mu,\Theta
μ,Θ是模型参数,比如说有
N
B
i
n
N_{Bin}
NBin个Bin,每个Bin的信号个数
S
(
Θ
)
S(\Theta)
S(Θ)和本底个数
B
(
Θ
)
B(\Theta)
B(Θ)是不同的.观测的结果
n
i
,
o
b
s
n_{i,obs}
ni,obs也是不同的.
其中
L
e
l
s
e
(
μ
;
Θ
)
L_{else}(\mu;\Theta)
Lelse(μ;Θ)是模型一种先验分布或者不关心的区域测量的最大似然函数,
比如说想要限制 μ \mu μ到 μ = 1.0 ± 0.1 \mu=1.0\pm 0.1 μ=1.0±0.1,那么 L e l s e ( μ ; Θ ) = exp [ − ( 1.0 − μ ) 2 2 ( 0.1 ) 2 ] L_{else}(\mu;\Theta)=\exp[-\frac{(1.0-\mu)^2}{2(0.1)^2}] Lelse(μ;Θ)=exp[−2(0.1)2(1.0−μ)2],即 μ \mu μ的限制(或者说constrain)是均值为1.0,方差为0.1的正态分布.这里因为最大似然函数可以差任意一个倍数所以归一化没写。
比如有一个区域没有信号,但是这块位置的拟合可以给信号区域的拟合提供帮助,那么 L e l s e ( μ ; Θ ) = ∏ B n i e − B n i ! L_{else}(\mu;\Theta)=\prod\frac{{B}^{n_i}e^{-B}}{n_i!} Lelse(μ;Θ)=∏ni!Bnie−B,即边带区域的似然函数(S=0)。
Asimov数据1
Asimov数据是指用当前的模型产生一个数据,这个数据具有一些好的性质:
- 它是模型中最有可能出现的结果
- 它可以用来估计模型参数的不确定性
- 它可以用来获得假设检验的预期结果及不确定性
Asimov满足(定义):
∂
log
L
(
n
i
,
A
s
i
m
o
v
;
θ
)
∂
θ
=
0
\frac{\partial \log L(n_{i,Asimov};\theta)}{\partial \theta}=0
∂θ∂logL(ni,Asimov;θ)=0
其中
θ
\theta
θ是模型参数(
μ
\mu
μ,
Θ
\Theta
Θ),而
n
i
,
A
s
i
m
o
v
n_{i,Asimov}
ni,Asimov是Asimov数据每个Bin的“观测值”.
参数估计及区间估计
way 1
最大似然估计法可以获得最大似然估计值,
θ
^
→
s
.
t
.
max
L
(
n
;
θ
)
\hat{\theta}\rightarrow s.t.\max{L(n;\theta)}
θ^→s.t.maxL(n;θ)
区间估计从最大似然函数曲线与一条
y
=
max
L
−
1
/
2
y=\max{L}-1/2
y=maxL−1/2的直线的交点得到。
(
θ
m
i
n
,
θ
m
a
x
)
→
s
.
t
.
L
(
n
;
θ
m
i
n
)
=
L
(
n
;
θ
m
a
x
)
=
max
L
−
s
2
/
2
(\theta_{min},\theta_{max})\rightarrow s.t.L(n;\theta_{min})=L(n;\theta_{max})=\max{L}-s^2/2
(θmin,θmax)→s.t.L(n;θmin)=L(n;θmax)=maxL−s2/2
其中
s
s
s表示几倍的
σ
\sigma
σ值,比如说
s
=
1.0
s=1.0
s=1.0表示68%置信区间.
way 2
利用似然比可以得到置信区间
λ
(
θ
)
≡
L
(
n
;
θ
)
L
(
n
;
θ
^
)
,
θ
^
→
s
.
t
.
max
L
(
n
;
θ
)
\lambda(\theta)\equiv \frac{L(n;\theta)}{L(n;\hat\theta)},\hat{\theta}\rightarrow s.t.\max{L(n;\theta)}
λ(θ)≡L(n;θ^)L(n;θ),θ^→s.t.maxL(n;θ)
由Wilks定理,
−
2
l
n
(
λ
(
θ
)
)
∼
χ
2
(
m
)
-2ln(\lambda(\theta))\sim \chi^2(m)
−2ln(λ(θ))∼χ2(m),所以可以得到
−
2
l
n
(
λ
(
θ
m
i
n
)
)
=
−
2
l
n
(
λ
(
θ
m
a
x
)
)
=
F
χ
2
−
1
(
1
−
α
,
m
)
-2ln(\lambda(\theta_{min}))=-2ln(\lambda(\theta_{max}))=F^{-1}_{\chi^2}(1-\alpha,m)
−2ln(λ(θmin))=−2ln(λ(θmax))=Fχ2−1(1−α,m)
协方差估计:
V
^
(
θ
i
)
=
(
−
∂
2
l
n
(
L
(
n
i
;
θ
)
)
∂
2
θ
i
∣
θ
^
)
−
1
\hat{V}(\theta_i)=(-\frac{\partial^2ln(L(n_i;\theta))}{\partial^2\theta_i}|_{\hat\theta})^{-1}
V^(θi)=(−∂2θi∂2ln(L(ni;θ))∣θ^)−1
特别的,边缘似然比:
λ ( θ 1 ) ≡ L ( n i ; θ 1 , θ ^ ^ 2 ) L ( n i ; θ ^ ) , θ ^ ^ 2 ( θ 1 ) → 给定 θ 1 , s . t . max L ( n i ; θ 1 , θ 2 ) \lambda(\theta_1)\equiv\frac{L(n_i;\theta_1,\hat{\hat\theta}_2)}{L(n_i;\hat\theta)},\hat{\hat\theta}_2(\theta_1)\rightarrow 给定\theta_1, s.t.\max{L(n_i;\theta_1,\theta_2)} λ(θ1)≡L(ni;θ^)L(ni;θ1,θ^^2),θ^^2(θ1)→给定θ1,s.t.maxL(ni;θ1,θ2)
假设检验
假设检验一定要有一个检验统计量,对于特定问题有特定的假设检验统计量。
奈曼-皮尔逊引理可以确定
t
≡
−
2
l
n
(
λ
(
θ
)
)
t\equiv -2ln(\lambda(\theta))
t≡−2ln(λ(θ))是最优统计量。定义
t
μ
≡
−
2
l
n
(
λ
(
μ
)
)
t_\mu\equiv -2ln(\lambda(\mu))
tμ≡−2ln(λ(μ)),其中
μ
\mu
μ是信号强度,即跟前面一致的
μ
\mu
μ,这里是边缘似然比,其他参数看不到了。由于实际问题往往有
μ
>
0
\mu>0
μ>0的限制实际的统计量稍微复杂一些。
现在来做一个上限的假设检验:
做上限的假设检验一般是不能排除
μ
=
0
\mu=0
μ=0情况下的检验。(也称为灵敏度分析)
对于一个给定的
μ
t
e
s
t
{\mu}_{test}
μtest值做假设检验。
H0: μ = μ t e s t \mu=\mu_{test} μ=μtest,H1: μ = 0 \mu=0 μ=0
t
μ
,
t
e
s
t
t_{\mu,{test}}
tμ,test在当模型
μ
=
μ
′
\mu=\mu'
μ=μ′的分布是清楚的,若
μ
t
e
s
t
=
μ
′
{\mu}_{test}=\mu'
μtest=μ′则服从中心卡方分布
χ
2
(
m
)
\chi^2(m)
χ2(m),m为参数个数(这里只有一个参数
μ
\mu
μ,m=1)。反之服从非中心卡方分布。
那么其实目前很清晰了,(如果真实世界确实是在当前模型下,一般假定),若真实世界服从
μ
′
\mu'
μ′的模型(注意:我们不知道这个数值),那么我们只需要确定
t
μ
,
t
e
s
t
t_{\mu,{test}}
tμ,test的观测数值是不是比较符合中心卡方分布即可!
如果符合,那么说明当前检验的
μ
t
e
s
t
{\mu}_{test}
μtest有可能是正确的。不能拒绝H0。
如果不太符合(例如用
p
0
p_0
p0量化描述一下不可能程度
p
0
<
0.05
p_0<0.05
p0<0.05),那我们就应该拒绝当前
μ
t
e
s
t
{\mu}_{test}
μtest作为真实信号强度的假设(当前
μ
t
e
s
t
{\mu}_{test}
μtest非常有可能不对)。拒绝H0
通过不断调整
μ
t
e
s
t
{\mu}_{test}
μtest的值,预计能够得到信号强度
μ
\mu
μ的上限。
CLs,CLsb,CLb
大致方向清楚了,但是细致想来如何量化"符合","不符合"呢?
上面一张图描述了
t
μ
,
t
e
s
t
t_{\mu,test}
tμ,test的分布情况,上面两个分布一个是真实世界
μ
′
=
μ
t
e
s
t
\mu'=\mu_{test}
μ′=μtest情况下
t
μ
,
t
e
s
t
t_{\mu,test}
tμ,test应该服从的分布H0,
另一个是真实世界
μ
′
=
0
\mu'=0
μ′=0的情况下
t
μ
.
t
e
s
t
t_{\mu.test}
tμ.test的分布,上面说过,若
μ
t
e
s
t
≠
μ
′
{\mu}_{test}\neq \mu'
μtest=μ′那么
t
μ
,
t
e
s
t
t_{\mu,test}
tμ,test服从非中心卡方分布,即图中的所示分布H1。
一个简单方法衡量图中的
p
0
p_0
p0值(
p
s
+
b
,
α
p_{s+b},\alpha
ps+b,α),如果
p
0
<
0.05
p_0<0.05
p0<0.05就拒绝H0。
但是如果本底
B
B
B很多(H1和H0分布几乎一致,因为
S
S
S影响不大),实际上如果
p
0
<
0.05
p_0<0.05
p0<0.05,很有可能这只是因为本底的波动导致的,不应该拒绝H0.
所以,我们需要一个更加严格的检验方法。
CLs就是一个更严格的检验方法。
- C L s = p 0 p 1 = p s + b 1 − P b = C L s + b C L b = α 1 − β CL_s=\frac{p_0}{p_1}=\frac{p_{s+b}}{1-P_b}=\frac{CL_{s+b}}{CL_b}=\frac{\alpha}{1-\beta} CLs=p1p0=1−Pbps+b=CLbCLs+b=1−βα
- C L s + b = p s + b = p 0 CL_{s+b}=p_{s+b}=p_0 CLs+b=ps+b=p0
- C L b = p 1 = 1 − P b CL_b=p_1=1-P_b CLb=p1=1−Pb
值的注意的是,检验统计量是可以不同的选择的,不过 C L s CL_s CLs判断方法是一致的。通过找到参数值 μ t e s t \mu_{test} μtest,使得在对 t μ , t e s t t_{\mu,test} tμ,test的检验发现 C L s = = 0.05 CL_s==0.05 CLs==0.05,对应的 μ t e s t \mu_{test} μtest就是在目前数据情况下给出的信号强度的上限。
提到数据,自然联想到之前说的Asimov数据,通过Asimov数据能够估计一个信号强度 μ \mu μ的上限,以及其不确定性。例如在纯本底假设下 μ = 0 \mu=0 μ=0的Asimov数据,就能得到纯本底假设下预期上限即不确定度。
下一步代码实现。
https://arxiv.org/abs/1007.1727v3 ↩︎