随机傅里叶特征(Random Fourier Features)

最新推荐文章于 2024-06-04 09:58:23 发布

Jie Qiao

最新推荐文章于 2024-06-04 09:58:23 发布

阅读量4.5k

点赞数 1

分类专栏：人工智能文章标签：人工智能

本文链接：https://blog.csdn.net/a358463121/article/details/111541560

版权

人工智能专栏收录该内容

51 篇文章 16 订阅

订阅专栏

随机傅里叶特征(Random Fourier Features)

如果使用核方法来预测测试集的样本 $\displaystyle x$ ，比如核岭回归kernel ridge regression，我们需要计算：

$=\sum ^{N}_{i=1} c_{i} k( x_{i} ,x)$

需要 $\displaystyle O( Nd)$ 其中N是样本量，d是x的维度大小。当样本量特别大的时候，这个复杂度是不可接受的。我们能不能找到一个近似方法，找到一个叫randomized feature map $\displaystyle z:R^{d}\rightarrow R^{D}$ 使得

$\phi ( x) ,\phi ( y)> \approx z( x)^{T} z( y)$

为了找到这么个z，我们先介绍一个在调和分析中，针对一类shift-invariant kernel的重要定理：

定理(Bochner [2])： 一个连续的核方法 $\displaystyle k( x,y) =k( x-y)$ ，在 $\displaystyle R^{d}$ 上是正定的，当且仅当 $\displaystyle k( \delta )$ 是某个非负测度的傅里叶变换。

首先意识到，概率测度是非负测度，因此，我们可以找到一个概率测度，使得k是它的傅里叶变换，也就是说：

$k(x-y)=\int _{R^{d}} p(\omega )e^{j\omega ^{\prime } (x-y)} d\omega =E_{\omega \sim p( w)} [\zeta _{\omega } (x)\zeta _{\omega } (y)^{*} ]$

其中 $\displaystyle \zeta _{\omega } (x)=e^{jw^{T} x}$ . 所以，理论上我们只需要从不停从 $\displaystyle p( w)$ 中采样 $\displaystyle w$ ，就能逼近 $\displaystyle k( x-y)$ 的取值。

其次，因为我们的kernel算出来是一个实数，所以 $\displaystyle \zeta _{\omega } (x)$ 中的复数，直观上可以丢掉，那么根据欧拉公式，丢掉之后就剩下cos项，所以，可以令 $\displaystyle z_{w}( x) =\sqrt{2}\cos\left( w^{T} x+b\right)$ ，来计算kernel：

$k(x,y)=E_{\omega \sim p( w)} [z_{w}( x) z_{w}( y) ]$

其中 $\displaystyle w\sim p( w) ,b\sim Uniform( 0,2\pi )$ .

接下来的问题是，怎样采样呢？这个概率测度 $\displaystyle p$ 是长什么样的呢？显然 $\displaystyle p( w)$ 的分布决定了kernel的形式，所以，他们应该是一种一一对应的关系，这个关系已经有人给我们算好了，如下图所示：

所以，最终实际使用的时候，我们只需根据我们选择的kernel函数，然后查查其对应的 $\displaystyle p( w)$ ，然后从中抽样 $\displaystyle w^{( 1)} ,...,w^{( D)} \sim p( w) ,b^{( 1)} ,...,b^{( D)} \sim Uniform[ 0,2\pi ]$ ，并估计均值

$k(x,y)\approx \frac{1}{D}\sum ^{D}_{i=1} z_{w^{( i)} ,b^{( i)}}( x) z_{w^{( i)} b^{( i)}}( y) =\mathbf{z}( x)^{T}\mathbf{z}( y)$

其中 $\displaystyle \mathbf{z}( x) \equiv \sqrt{\frac{2}{D}}\begin{bmatrix} \cos\left(\left( w^{( 1)}\right)^{T} x+b^{( 1)}\right)\\ \vdots \\ \cos\left(\left( w^{( D)}\right)^{T} x+b^{( D)}\right) \end{bmatrix}$ .

参考文献

[1] Rahimi, Ali, and Benjamin Recht. “Random features for large-scale kernel machines.” Advances in neural information processing systems 20 (2007): 1177-1184.
[2] W. Rudin. Fourier Analysis on Groups. Wiley Classics Library. Wiley-Interscience, New York, reprint
edition edition, 1994.

Jie Qiao

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
随机傅里叶特征(Random Fourier Features)

随机傅里叶特征(Random Fourier Features)如果使用核方法来预测测试集的样本x\displaystyle xx，比如核岭回归kernel ridge regression，我们需要计算：f(x)=∑i=1Ncik(xi,x)f( x) =\sum ^{N}_{i=1} c_{i} k( x_{i} ,x)f(x)=i=1∑Ncik(xi,x)需要O(Nd)\displaystyle O( Nd)O(Nd)其中N是样本量，d是x的维度大小。当样本量特别大的时候，这个复杂度是
复制链接

扫一扫