支持向量机 6 密度估计的方法

本文探讨了支持向量机(SVM)在密度估计问题中的使用,包括解决条件概率估计和条件密度估计问题。通过构建再生核希尔伯特空间(RKHS)和选择合适的核函数,SVM能够估计概率密度并满足特定约束条件,如最小化正则化泛函和保持一致度量。文中详细介绍了SVM如何转换问题并应用ε-不敏感损失函数来求解。
摘要由CSDN通过智能技术生成

6 密度估计的方法

# 本节内容中约束条件需要由某些一致性定理保证,这里没有给出。

SVM用于密度估计问题

密度估计问题可以表述为:
求解概率密度
p ( t , a ) : ∫ − ∞ x p ( t , α ) d t = F ( x ) p(t,a): \int_{-\infty}^x p(t, \alpha) dt = F(x) p(t,a):xp(t,α)dt=F(x)
已知 ( x i ) (x_i) (xi) 为 满足 F ( x ) F(x) F(x) 分布的随机独立样本集,并据此可给出经验分布函数
F l ( x ) = 1 l ∑ i = 1 l θ ( x − x i ) F_l(x) = \dfrac{1}{l} \sum\limits_{i=1}^l \theta(x-x_i) Fl(x)=l1i=1lθ(xxi)
θ \theta θ 为阶跃函数。

考虑使用一致度量来定义概率分布与经验分布之间的距离
ρ ( F ( x ) , F l ( x ) ) = sup ⁡ x ∣ F ( x ) − F l ( x ) ∣ \rho(F(x),F_l(x)) = \sup\limits_x |F(x) - F_l(x)| ρ(F(x),Fl(x))=xsupF(x)Fl(x)
由某再生核希尔伯特空间(Reproducing Kernel Hilbert Space, RKHS)的模定义正则化泛函
Ω ( f ) = ( f , f ) H \Omega(f) = (f,f)_H Ω(f)=(f,f)H
首先先构造RKHS。设有对称正定核
K ( x , y ) = ∑ i = 1 ∞ λ i ϕ i ( x ) ϕ i ( y ) K(x,y) = \sum\limits_{i=1}^\infty \lambda_i \phi_i(x)\phi_i(y) K(x,y)=i=1λiϕi(x)ϕi(y)
定义的希尔伯特空间H的内积 ( f , g ) H (f,g)_H (f,g)H 需要满足再生特性
( f ( x ) , K ( x , y ) ) H = f ( y ) , ∀ f ∈ H (f(x),K(x,y))_H = f(y), \forall f \in H (f(x),K(x,y))H=f(y),fH
考虑函数集
f ( x , c ) = ∑ i = 1 ∞ c i ϕ i ( x ) f(x,c) = \sum\limits_{i=1}^\infty c_i \phi_i(x) f(x,c)=i=1ciϕi(x)
及定义在其上的内积
( f ( x , c ) , f ( x , d ) ) H = ∑ i = 1 ∞ c i d i λ i (f(x,c), f(x,d))_H = \sum\limits_{i=1}^\infty \dfrac{c_i d_i}{\lambda_i} (f(x,c),f(x,d))H=i=1λicidi

( f ( x , c ) , K ( x , y ) ) H = ( f ( x , c ) , f ( x , λ i ϕ i ( y ) ) ) H = ∑ i = 1 ∞ c i λ i ϕ i ( y ) λ i = f ( y ) (f(x,c), K(x,y))_H = (f(x,c), f(x, \lambda_i \phi_i(y)))_H = \sum\limits_{i=1}^\infty \dfrac{c_i \lambda_i \phi_i(y)}{\lambda_i} = f(y) (f(x,c),K(x,y))H=(f(x,c),f(x,λiϕi(y)))H=i=1λiciλiϕi(y)=f(y)
因此上述定义满足再生特性, f , K , ( f , g ) H f,K,(f,g)_H f,K,(f,g)H 构成了RKHS。
寻找如下形式解
f ( x ) = ∑ i = 1 l β i K ( x i , x ) = ∑ k = 1 ∞ ∑ i = 1 l β i λ k ϕ k ( x i ) ϕ k ( x ) ,     β i ≥ 0 f(x) = \sum\limits_{i=1}^l \beta_i K(x_i, x) = \sum\limits_{k=1}^\infty \sum\limits_{i=1}^l \beta_i \lambda_k \phi_k(x_i) \phi_k(x),\ \ \ \beta_i \ge 0 f(x)=i=1lβiK(xi,x)=k=1i=1lβiλkϕk(xi)ϕk(x),   βi0
使用方法P(Phillips 残差方法, 1962)解决密度估计问题,即最小化泛函
Ω ( f ) = ( f , f ) H ,     sup ⁡ x ∣ F ( x ) − F l ( x ) ∣ = σ l \Omega(f) = (f,f)_H,\ \ \ \sup\limits_x |F(x) - F_l(x)| = \sigma_l Ω(f)=

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值