《统计学习方法》--核函数的学习:对字符串核函数的补充

  在《统计学习方法》第一版P123或第二版P141中提到:
  字符串核函数的映射 ϕ n ( s ) \phi_n(s) ϕn(s) 将字符串 s s s 对应于希尔伯特空间的一个向量,其在子串 u u u 维上的取值为: [ ϕ n ( s ) ] u = ∑ i : s ( i ) = u λ l ( i ) [\phi_n(s)]_u=\sum_{i:s(i)=u}{\lambda^{l(i)}} [ϕn(s)]u=i:s(i)=uλl(i)  这里, 0 < λ ≤ 1 0<\lambda\leq1 0<λ1 是一个衰减参数, l ( i ) l(i) l(i) 表示字符串 i i i 的长度,求和在 s s s 中所有与 u u u 相同的字串上进行。
  两个字符串 s s s t t t 上的字符串核函数是基于映射 ϕ n \phi_n ϕn 的特征空间中的内积:
k n ( s , t ) = ∑ u ∈ ∑ n [ ϕ n ( s ) ] u [ ϕ n ( t ) ] u = ∑ u ∈ ∑ n ∑ ( i , j ) : s ( i ) = t ( i ) = u λ l ( i ) λ l ( j ) \begin{aligned} k_n(s,t) & =\sum_{u\in\sum^n}{[\phi_n(s)]_u[\phi_n(t)]_u} \\ & =\sum_{u\in\sum^n}{\sum_{(i,j):s(i)=t(i)=u}{\lambda^{l(i)}\lambda^{l(j)}}} \\ \end{aligned} kn(s,t)=un[ϕn(s)]u[ϕn(t)]u=un(i,j):s(i)=t(i)=uλl(i)λl(j)  这里, ∑ n \sum^n n表示所有长度为 n n n的字符串的集合。
  其他博文中出现了以下这个例子:

在这里插入图片描述
  按上述公式,
k ( f o g , f o g ) = ∑ u ∈ ∑ n [ ϕ n ( f o g ) ] u [ ϕ n ( f o g ) ] u = λ 2 × λ 2 + λ 3 × λ 3 + λ 2 × λ 2 = 2 λ 4 + λ 6 \begin{aligned} k(fog,fog) & =\sum_{u\in\sum^n}{[\phi_n(fog)]_u[\phi_n(fog)]_u} \\ & =\lambda^2\times\lambda^2+\lambda^3\times\lambda^3+\lambda^2\times\lambda^2 \\ & =2\lambda^4+\lambda^6 \end{aligned} k(fog,fog)=un[ϕn(fog)]u[ϕn(fog)]u=λ2×λ2+λ3×λ3+λ2×λ2=2λ4+λ6

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值