[神经网络]2.2/2.3-How the backpropagation algorithm works-The two assumptions we need...（翻译）

最新推荐文章于 2024-07-17 02:03:42 发布

mapw1993

最新推荐文章于 2024-07-17 02:03:42 发布

阅读量662

点赞数

分类专栏：机器学习与数据挖掘文章标签：神经网络函数算法

机器学习与数据挖掘专栏收录该内容

16 篇文章 1 订阅

订阅专栏

The two assumptions we need about the cost function(2个关于成本函数的假设)

反向传播的全局是计算网络的成本函数 $C$ 关于权重 $w$ 和偏差 $b$ 的偏导数 $\partial C/\partial w$ 和 $\partial C/\partial b$ 。关于反向传播的工作，我们需要做2个主要的假设。在开始假设之前，在头脑中有一个成本函数的例子是有用的。我们将使用最后一张的二次成本函数（方程（6））。形式如下：
$C=\frac{1}{2n}\sum_x||y(x)-a^L(x)||^2\space\space\space\space\space\space\space\space\space\space\space\space\space\space\space\space\space\space(26)$

这里: $n$ 是训练样本的总数；sum指的是所有独立训练样本x的和； $y=y(x)$ 是对应的所期望的输出； $L$ 定义了网络层的数量;并且 $a^L=a^L(x)$ 是当x是输入的时候，网络的输出。

好了，那么我们需要做些什么假设来了解我们的成本函数 $C$ ，以使反向传播可以被应用？第一个假设是，成本函数可以写成平均 $C=\frac{1}{n}\sum_xC_x$ ，其中 $x$ 是训练样本。又因为这是平方的成本的函数，因此一个训练样本的成本是 $C_x=\frac{1}{2}||y-a^L||^2$ .这个假设也适用于所有本书中其它成本函数。

我们这样假设的原因，是因为反向传播实际上是计算偏导数（求导后，系数为1）。记住这个假设，我们将成本函数 $C_x$ 写成 $C$ 。我们最终会将 $x$ 放回，但是现在省去符号的麻烦。

第二个假设我们需要做的是，成本可以被写成是神经网络的输出函数：
这里写图片描述
举个例子，平方成本函数满足这个要求，因为对于每个训练样本 $x$ ,平方成本可以写成:
$C=\frac{1}{2}||y-a^L||^2=\frac{1}{2}\sum_j(y_j-a_j^L)^2 \space\space\space\space\space\space\space\space\space\space\space\space\space\space\space\space\space\space（27）$

并且因此是输出激活的函数。当然，成本函数也依赖于我们期望的输出 $y$ ，并且你可能会奇怪为什么不考虑成本为 $y$ 的函数。记住，虽然训练的例子 $x$ 是固定的，所以输出 $y$ 也是一个固定参数。特别是，它不是我们可以修改权重和偏差的东西，即，它不是神经网络学习的东西。并因此把C作为一个单独的输出激活 $a^L$ 功能， $y$ 是一个参数，有助于定义函数。

The Hadamard product, s⊙t（Hadamard乘积，s⊙t）

反向传播算法基于普通线性代数运算-比如向量加法、矩阵的乘法等等。但是有一些运算平时很少被使用。特别地，假设 $s$ 和 $t$ 是具有相同维度的2个向量。那么我们使用 $s\bigodot t$ 来定义向量元素的乘积。那么 $s\bigodot t$ 等价于 $(s\bigodot t)=s_jt_j$ 。下面是一个例子：
这里写图片描述
这种对应元素相乘有时也被称为Hadamard乘法或者Schur乘法。我们这里称它为Hadamard乘法。好的矩阵库提供了Hadamard乘积的快速实现，并且将在实现反向传播时使用。

mapw1993

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[神经网络]2.2/2.3-How the backpropagation algorithm works-The two assumptions we need...（翻译）

The two assumptions we need about the cost function(2个关于成本函数的假设)反向传播的全局是计算网络的成本函数CC关于权重ww和偏差bb的偏导数∂C/∂w\partial C/\partial w和∂C/∂b\partial C/\partial b。关于反向传播的工作，我们需要做2个主要的假设。在开始假设之前，在头脑中有一个成本函数的例子是有用的
复制链接

扫一扫