经验似然的基本思想
回顾一下
经验似然方法不假设参数分布,直接把分布函数 F F F当做参数,其似然函数是 L ( F ) = ∏ i = 1 n { F ( X i + ) − F ( X i − ) } = ∏ i = 1 n d F ( X i ) L(F)=\mathop{\prod}\limits_{i=1}^n\{F(X_i+)-F(X_i-)\}=\mathop{\prod}\limits_{i=1}^ndF(X_i) L(F)=i=1∏n{
F(Xi+)−F(Xi−)}=i=1∏ndF(Xi)
为了方便,通常记 p i = d F ( X i ) p_i=dF(X_i) pi=dF(Xi). 上述似然和对数似然可以表示为
L ( F ) = ∏ i = 1 n p i , l ( F ) = ∑ i = 1 n l o g ( p i ) L(F)=\mathop{\prod}\limits_{i=1}^np_i,l(F)=\mathop{\sum}\limits_{i=1}^nlog(p_i) L(F)=i=1∏npi,l(F)=i=1∑nlog(pi)
注意,这里的参数 p i p_i pi应满足: 0 ≤ p i ≤ 1 , ∑ i = 1 n p i ≤ ∫ d F ( x ) = 1 0\le p_i\le 1,\mathop{\sum}\limits_{i=1}^np_i\le \int dF(x)=1 0≤pi≤1,i=1∑npi≤∫dF(x)=1
分布函数的最大经验似然估计
根据几何平均不大于算数平均,可知
L ( F ) = ∏ i = 1 n p i ≤ ( 1 n ∑ i = 1 n p i ) n ≤ n − n L(F)=\mathop{\prod}\limits_{i=1}^np_i\le (\frac{1}{n}\mathop{\sum}\limits_{i=1}^np_i)^n\le n^{-n} L(F)=i=1∏npi≤(n1i=1∑npi)n≤n−n
当且仅当 p i = 1 / n p_i=1/n pi=1/n时等号成立.
所以最大化 L ( F ) L(F) L(F)的分布是经验分布
F n ( x ) = 1 n ∑ i = 1 n 1 ( X i ≤ x ) F_n(x)=\frac{1}{n}\mathop{\sum}\limits_{i=1}^n1(X_i\le x) Fn(x)=n1i=1∑n1(Xi≤x)
其中 X i ≤ x X_i\le x Xi≤x表示 X i X_i Xi的各分量分别小于 x x x的各分量.
即,经验分布 F n F_n Fn是 F F F的极大经验似然估计. 这套非参数方法被称作经验似然.
注意到,如果 F F F在 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn任何一处连续,那么 L ( F ) = 0 L(F)=0 L(F)=0
如果 ∑ i = 1 n p i < 1 \mathop{\sum}\limits_{i=1}^np_i<1 i=1∑npi<1,那么取
p i ∗ = p i / ∑ i = 1 n p i , i = 1 , . . , n p_i^*=p_i/\mathop{\sum}\limits_{i=1}^np_i,i=1,..,n pi∗=pi/i=1∑npi,i=1,..,n
容易看到 ∑ i = 1 n p i ∗ = 1 \mathop{\sum}\limits_{i=1}^np_i^*=1 i=1∑npi∗=1,且 p i ∗ p_i^* pi∗的经验似然大于 p i p_i pi的经验似然。根据似然越大参数越靠谱的原则,这类 p i p_i pi不需要再考虑.
这意味着以后我们不防要求 F F F满足 ∑ i = 1 n p i = 1 \mathop{\sum}\limits_{i=1}^np_i=1 i=1∑npi=1,或者等价的 F < < F n F<<F_n F<<Fn,也等价于假设 F ( x ) = ∑ i = 1 n p i I ( X i ≤ x ) F(x)=\sum_{i=1}^n p_iI(X_i\le x) F(x)=∑i=1npi</