KDE窗宽选择中的最小二乘交错间定法

窗宽参数的选择方法, 一般有经验法, 插入法, 交错鉴定法等方法. 以下介绍最小二乘交错鉴定法, 并将其作为本文的窗宽选择方法.

最小二乘交错鉴定法(Least-squares cross-validation,LSCV)是是基于这样的思想, 即选取的窗宽参数值能够最小化估计函数的积分平方误差. 以下先考虑单变量的情形.

定义 f ^ ( x ) \hat{f}(x) f^(x) f ( x ) f(x) f(x)之差的平方的积分为
∫ [ f ^ ( x ) − f ( x ) ] 2 d x = ∫ f ^ ( x ) 2 d x − 2 ∫ f ^ ( x ) f ( x ) d x + ∫ f ( x ) 2 d x \begin{equation} \int[\hat{f}(x) - f(x)]^2dx = \int\hat{f}(x)^2dx -2\int\hat{f}(x)f(x)dx +\int f(x)^2dx \end{equation} [f^(x)f(x)]2dx=f^(x)2dx2f^(x)f(x)dx+f(x)2dx
( 4 ) (4) (4)的右边第三项和 h h h无关, 所以最小化(4)等价于最小化
∫ f ^ ( x ) 2 d x − 2 ∫ f ^ ( x ) f ( x ) d x \begin{equation} \int\hat{f}(x)^2dx -2\int\hat{f}(x)f(x)dx \end{equation} f^(x)2dx2f^(x)f(x)dx

为了最小化式 ( 5 ) (5) (5), 我们先观察式 ( 5 ) (5) (5)的结构. 第一项 ∫ f ^ ( x ) 2 d x \large \int\hat{f}(x)^2dx f^(x)2dx可以用下面的式子估计:
∫ f ^ ( x ) 2 d x = 1 n 2 h 2 ∑ i = 1 n ∑ j = 1 n ∫ k ( X i − x h ) k ( X j − x h ) d x = 1 n 2 h ∑ i = 1 n ∑ j = 1 n k ˉ ( X i − X j h ) \begin{equation} \begin{aligned} \int\hat{f}(x)^2dx =& \frac{1}{n^2h^2}\sum_{i=1}^n\sum_{j=1}^n \int k(\frac{X_i-x}{h}) k(\frac{X_j-x}{h}) dx \\ =& \frac{1}{n^2h}\sum_{i=1}^n\sum_{j=1}^n\bar{k}(\frac{X_i-X_j}{h}) \end{aligned} \end{equation} f^(x)2dx==n2h21i=1nj=1nk(hXix)k(hXjx)dxn2h1i=1nj=1nkˉ(hXiXj)

其中 k ˉ ( v ) = ∫ k ( u ) k ( v − u ) d u \bar{k}(v) = \int k(u)k(v-u)du kˉ(v)=k(u)k(vu)du称为 k ( v ) k(v) k(v)的双重卷积核. 例如, 对于标准正态核$ k(v) = \frac{1}{\sqrt{2\pi}}e{-\frac{1}{2}v2} , 其双重卷积核为 , 其双重卷积核为 ,其双重卷积核为 \bar{k}(v) = \frac{1}{\sqrt{4\pi}}e{-\frac{1}{4}v2}$, 也就是一个均值为0, 方差为2的正态概率密度函数.

而式 ( 5 ) (5) (5)的第二项中的 ∫ f ^ ( x ) f ( x ) d x \int\hat{f}(x)f(x)dx f^(x)f(x)dx, 其实就是随机变量函数 f ^ ( X ) \hat{f}(X) f^(X)的期望, 可以写为 E X [ f ^ ( X ) ] E_X[\hat{f}(X)] EX[f^(X)]. 而对于期望, 我们可以用其样本均值对其进行估计, 也就是用下式
E X ^ [ f ^ ( X ) ] = 1 n ∑ i = 1 n f ^ − i ( X i ) \begin{equation} \hat{E_X}[\hat{f}(X)] = \frac{1}{n}\sum_{i=1}^n \hat{f}_{-i}(X_i) \end{equation} EX^[f^(X)]=n1i=1nf^i(Xi)

其中
f ^ − i ( X i ) = 1 ( n − 1 ) h   ∑ j = 1 , j ≠ i n k ( X i − X j h ) \begin{equation} \hat{f}_{-i}(X_i) = \frac{1}{(n-1)h} \ \sum_{j=1, j\neq i}^n k(\frac{X_i-X_j}{h}) \end{equation} f^i(Xi)=(n1)h1 j=1,j=ink(hXiXj)

( 8 ) (8) (8)称为 f ( X i ) f(X_i) f(Xi)的去一核估计量(leave-one-out kernal estimator).

因此, 我们可以将式 ( 4 ) (4) (4)定义最小二乘交错鉴定法的目标函数
C V f ( h ) = 1 n 2 h ∑ i = 1 n ∑ j = 1 n k ˉ ( X i − X j h ) − 1 n ( n − 1 ) h   ∑ j = 1 , j ≠ i n k ( X i − X j h ) \begin{equation} CV_f(h) = \frac{1}{n^2h}\sum_{i=1}^n\sum_{j=1}^n\bar{k}(\frac{X_i-X_j}{h}) - \frac{1}{n(n-1)h} \ \sum_{j=1, j\neq i}^n k(\frac{X_i-X_j}{h}) \end{equation} CVf(h)=n2h1i=1nj=1nkˉ(hXiXj)n(n1)h1 j=1,j=ink(hXiXj)

并将单变量KDE方法的窗宽选择转化为以下优化问题:
min ⁡ h    C V f ( h ) \begin{equation} \min \limits_h\ \ CV_f(h) \end{equation} hmin  CVf(h)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值