6.3.1 Nadaraya-Watson模型(PRML读书笔记)

  在3.3.3节,我们看到,对于新的输⼊ x x x,线性回归模型的预测的形式为训练数据集的⽬标值的线性组合,组合系数由“等价核”(3.62)给出,其中等价核满⾜加和限制(3.64)。
  我们可以从核密度估计开始,以⼀个不同的角度研究核回归模型(3.61)。假设我们有⼀个训练集 { x n , t n } \{\textbf{x}_n, t_n\} {xn,tn},我们使⽤Parzen密度估计来对联合分布 p ( x , t ) p(x,t) p(x,t)进⾏建模,即
在这里插入图片描述
其中 f ( x , t ) f(\textbf{x},t) f(x,t)是分量密度函数,每个数据点都有⼀个以数据点为中⼼的这种分量。我们现在要找到回归函数 y ( x ) y(\textbf{x}) y(x)的表达式
在这里插入图片描述
简单起见,我们现在假设分量的密度函数的均值为零(对所有 x \textbf{x} x都成立),即
在这里插入图片描述
使⽤⼀个简单的变量替换,我们有(公式6.45的推导见附录“公式推导”)
在这里插入图片描述
其中 n , m = 1 , . . . , N n,m = 1,...,N n,m=1,...,N,且核函数 k ( x , x n ) k(\textbf{x}, \textbf{x}_n) k(x,xn)
在这里插入图片描述
其中
在这里插入图片描述
公式(6.45)给出的结果被称为Nadaraya-Watson模型,或者称为核回归。对于⼀个局部核函数,它的性质为:给距离 x \textbf{x} x较近的数据点 x n \textbf{x}_n xn较⾼的权重(如何看出这一点的)。注意,核(6.46)满⾜加和限制
在这里插入图片描述

附录

公式推导

  • 公式6.43如何推导到公式6.45
    先看公式6.43的分母,由公式6.47,很容易得
    ∑ m ∫ f ( x − x n , t − t n ) d t = ∑ m g ( x − x n ) \sum_{m}{\int{f(\textbf{x}-\textbf{x}_n,t-t_{n})dt}}=\sum_{m}g(\textbf{x}-\textbf{x}_n) mf(xxn,ttn)dt=mg(xxn)再看分子
    ∑ n ∫ t f ( x − x n , t − t n ) d t \sum_{n}{\int{tf(\textbf{x}-\textbf{x}_n,t-t_{n})dt}} ntf(xxn,ttn)dt做变量替换 l = t − t n l=t-t_{n} l=ttn,得 t = l + t n t=l+t_{n} t=l+tn d t = d l dt=dl dt=dl,于是
    ∑ n ∫ t f ( x − x n , t − t n ) d t = ∑ n ∫ ( l + t n ) f ( x − x n , l ) d l = ∑ n ∫ l f ( x − x n , l ) d l + ∑ n ∫ t n f ( x − x n , l ) d l = ∑ n g ( x − x n ) t n \sum_{n}{\int{tf(\textbf{x}-\textbf{x}_n,t-t_{n})dt}}=\sum_{n}{\int{(l+t_{n})f(\textbf{x}-\textbf{x}_n,l)dl}} \\ =\sum_{n}{\int{lf(\textbf{x}-\textbf{x}_n,l)dl}}+\sum_{n}{\int{t_{n}f(\textbf{x}-\textbf{x}_n,l)dl}} \\=\sum_{n}g(\textbf{x}-\textbf{x}_n)t_n ntf(xxn,ttn)dt=n(l+tn)f(xxn,l)dl=nlf(xxn,l)dl+ntnf(xxn,l)dl=ng(xxn)tn

延展讨论

  • 核函数的加和限制(文末)必须满足么,还是仅仅在核回归中必须满足?
    应该不是必须满足(例如公式6.9),但是核回归应该是要满足的。
  • 如何选择核函数,如何求解核函数
  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值