统计决策的问题
样本空间和分布族
X ∼ ( X , B , { P θ , θ ∈ Θ ⊂ R k } ) X\sim (\mathcal{X},\mathcal{B},\{P_{\theta},\theta\in\Theta \subset \mathcal{R}^k\}) X∼(X,B,{Pθ,θ∈Θ⊂Rk}),或 X ∼ f ( x , θ ) , θ ∈ Θ ⊂ R k X \sim f(x, \theta),\theta \in \Theta \subset\mathcal{R}^k X∼f(x,θ),θ∈Θ⊂Rk. X \mathcal{X} X为样本空间,表示随机变量X的一切可能取值, B \mathcal{B} B是 X \mathcal{X} X的某些子集构成的 σ \sigma σ域。
判决空间和判决函数
分别用 D \mathcal{D} D和 B D \mathcal{B}_{\mathcal{D}} BD表示,其中 D \mathcal{D} D至少包含两个元素, B D \mathcal{B}_{\mathcal{D}} BD是 D \mathcal{D} D上的Borel域, d ∈ D d\in\mathcal{D} d∈D称为判决,通常d是样本 X = x X=x X=x的函数,即 d = δ ( x ) d=\delta(x) d=δ(x),称为统计判决函数,简称判决函数。严格地, δ ( x ) : Ω → D \delta(x):\Omega\rightarrow\mathcal{D} δ(x):Ω→D为可测函数, δ ( x ) 是 一 个 统 计 量 \delta(x)是一个统计量 δ(x)是一个统计量
损失函数和风险函数
L
(
θ
,
d
)
:
Θ
×
D
→
R
L(\theta,d):\Theta\times\mathcal{D}\rightarrow R
L(θ,d):Θ×D→R且
L
(
θ
,
d
)
>
0
L(\theta,d)>0
L(θ,d)>0,则称为损失函数。表示在参数
θ
\theta
θ下,采取判决d时带来的损失。
给定统计判决函数
δ
(
x
)
\delta(x)
δ(x)和损失函数
L
(
θ
,
d
)
L(\theta,d)
L(θ,d)风险函数定义为
R
(
θ
,
δ
)
=
E
θ
[
L
(
θ
,
δ
(
X
)
)
]
=
∫
X
L
(
θ
,
δ
(
x
)
)
d
P
θ
(
x
)
R(\theta,\delta)=E_{ \theta}[L(\theta,\delta(X))]=\int_{\mathcal{X}}L(\theta,\delta(x))dP_{\theta}(x)
R(θ,δ)=Eθ[L(θ,δ(X))]=∫XL(θ,δ(x))dPθ(x)