Neural Network Fundamental (2)

最適当承诺

已于 2022-03-03 21:37:07 修改

阅读量416

点赞数

分类专栏：神经网络学习文章标签：神经网络深度学习机器学习

于 2022-03-01 12:47:38 首次发布

本文链接：https://blog.csdn.net/upr_rom/article/details/122978286

版权

神经网络学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

Radial-Basis Function Networks

RBF神经网络: 将输入向量与多个中心点（与输入向量相同维度）（数量可根据设计进行改变）的欧式距离进行计算，排除其他的信息。对一个中心点距离相同的点，在此神经元中可以看作相同。
在这里插入图片描述

RBF结构
如果单纯将欧式距离进行输出，那么距离越近，输出越小;距离越大，输出越大。
但是，我们实际上是希望 越靠近中心点，值越大。因此在选择第一层神经元的激活函数时，应该选用输出与输入成反比的函数。我们选用 高斯分布，距离为0时，值最大。

在这里插入图片描述
我们可以看到 RBF网络中：第一层我们将输入 $\vec x$ 与第i个中心点 $\vec x_i$ 求欧式距离，然后使用激活函数（高斯分布）得到第一层的输出。第二层则是按权重求和，纯线性关系，激活函数可以根据需要进行选择。也就是说，第二层和 MLP 是一样的，只有第一层是不同的。
因此，我们需要优化的就是第一层的中心点如何设定/更新，以及第二层的权重如何更新。

Exact Interpolation

我们使用和数据点相同数目的神经元，然后将每一个数据点都作为中心点。这样子就可以得到完美的拟合。
数学上表达出来：
对于n个数据点，每个数据点的维度是m， ${x_i \in R^{m},i=1,2, \dots ,n}$ ，想要的输出是 $d_i$ .
那么我们将每一个数据点都作为中心点，在BP神经元的第一层设计n个中心点，分别是 $x_j$ ，那么第一层输出后，到第二层的权重就有 $w_j$
我们想要对于所有的输入点 $x_i$ ，都有输出 $d_i$ .
$\sum_j^{n} w_j \varphi ( x_i-x_j ) = d_i$
$\sum_j^{n} w_j \varphi_{ij} =d_i$
那就可以得到矩阵: $\phi W = \vec d$
那么，就可以得到第二层的权重： $W=\phi^{-1} \vec d$
但是这样子造成overfitting, 范化（generalizaton）会很差；而且对于大量的数据而言，结构也过大。 因此，精确插值不是对于大数据模型不是一种好方法。

Learning

我们可以设置一定数目（ $k$ 个）中心点，将每个中心点随机设置成 $x_j=\{ \mu_{j1},\mu_{j2},\dots,\mu_{jm}\}$ ，并对每一个中心点设置一个 $\sigma_j$ , 另外在输出层设置一个偏置 $b$ ，然后我们就可以得到 $f(x)=\sum_{i=1}^{k}w_i \varphi(||x-x_i ||)$ ，其中 $\varphi(r)=e^{-\frac{r^2}{2\sigma^2}}$ 。
然后我们就可以将 $\vec \sigma,\vec \mu, \vec w$ 根据 Steepest Descent Method 进行更新。