cs231n神经网络笔记

最新推荐文章于 2019-09-02 22:09:39 发布

慕森

最新推荐文章于 2019-09-02 22:09:39 发布

阅读量301

点赞数

分类专栏：机器学习文章标签： cs231n

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

知乎官方笔记翻译神经网络下

神经元被激活是什么意思？
输入传入神经元，计算得到的结果若高于阈值则神经元有了输出，如果神经元一直没有输出，就不会产生梯度更新。
全连接层是什么？
对于普通神经网络，最普通的层的类型是全连接层（fully-connected layer）。全连接层中的神经元与其前后两层的神经元是完全成对连接的，但是在同一个全连接层内的神经元之间没有连接。

当我们说N层神经网络的时候，我们没有把输入层算入。因此，单层的神经网络就是没有隐层的（输入直接映射到输出）
神经网络的尺寸是什么意思？

用来度量神经网络的尺寸的标准主要有两个：一个是神经元的个数，另一个是参数的个数，用上面图示的两个网络举例：

第一个网络有4+2=6个神经元（输入层不算），[3x4]+[4x2]=20个权重，还有4+2=6个偏置，共26个可学习的参数。
第二个网络有4+4+1=9个神经元，[3x4]+[4x4]+[4x1]=32个权重，4+4+1=9个偏置，共41个可学习的参数。
神经网络方法中如何控制过拟合？
防止神经网络的过拟合有很多方法（L2正则化，dropout和输入噪音等），后面会详细讨论。在实践中，使用这些方法来控制过拟合比减少网络神经元数目要好得多
正则化强度是控制神经网络过拟合的好方法。

不同正则化强度的效果：每个神经网络都有20个隐层神经元，但是随着正则化强度增加，它的决策边界变得更加平滑。
需要记住的是：不应该因为害怕出现过拟合而使用小网络。相反，应该进尽可能使用大网络，然后使用正则化技巧来控制过拟合

实践操作。在这个笔记中提到PCA和白化主要是为了介绍的完整性，实际上在卷积神经网络中并不会采用这些变换。然而对数据进行零中心化操作还是非常重要的，对每个像素进行归一化也很常见。

常见错误。进行预处理很重要的一点是：任何预处理策略（比如数据均值）都只能在训练集数据上进行计算，算法训练完毕后再应用到验证集或者测试集上。例如，如果先计算整个数据集图像的平均值然后每张图片都减去平均值，最后将整个数据集分成训练/验证/测试集，那么这个做法是错误的。应该怎么做呢？应该先分成训练/验证/测试集，只是从训练集中求图片平均值，然后各个集（训练/验证/测试集）中的图像再减去这个平均值。

慕森

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
cs231n神经网络笔记

知乎官方笔记翻译神经网络下神经元被激活是什么意思？输入传入神经元，计算得到的结果若高于阈值则神经元有了输出，如果神经元一直没有输出，就不会产生梯度更新。全连接层是什么？对于普通神经网络，最普通的层的类型是全连接层（fully-connected layer）。全连接层中的神经元与其前后两层的神经元是完全成对连接的，但是在同一个全连接层内的神经元之间没有连接。当我们说N层神经网络的
复制链接

扫一扫