CNN笔记(2)--网络参数初始化

最新推荐文章于 2024-04-20 10:46:41 发布

Codename-NC

最新推荐文章于 2024-04-20 10:46:41 发布

阅读量4.5k

点赞数

分类专栏：笔记-算法文章标签： CNN 参数初始化

本文链接：https://blog.csdn.net/ericcchen/article/details/80101981

版权

笔记-算法专栏收录该内容

17 篇文章 2 订阅

订阅专栏

7网络参数初始化

7.1 全零初始化

网络收敛到稳定状态时，参数（权值）在理想情况下应基本保持正负各半，期望为0

全0初始化可以使初始化全零时参数期望为0

但是，全0初始化不能训练

7.2随机初始化

仍然希望参数期望接近1

随机参数服从高斯分布或均匀分布进行初始化

7.2.1.高斯分布

高斯分布为均值为0，方差为1 的标准高斯分布

w = 0.001 .* randn(n_in,n_out);    %0.001控制参数量纲，使参数期望保持在接近0的较小数值范围内

即网络输出数据分布的方差会随着输入神经元个数改变

7.2.2.Xaiver参数初始化方法

对方差大小规范化

w = (0.001 .* randn(n_in, n_out)) ./ sqrt(n);

乘上 $\frac{1}{\sqrt{n}}$

7.2.3.He参数初始化

乘上 $\frac{1}{\sqrt{n/2}}$

收敛效果更好

7.2.4 均匀分布

在区间[low,high]上成规范化系数

7.3其他初始化

采用预训练模型
数据敏感的参数初始化方式

参考文献：解析卷积神经网络—深度学习实践手册

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Codename-NC

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Deep Learning 之参数初始化

BVL的博客

04-26

9739

本文仅对常见的参数初始化方法进行总结（大部分内容来自deep learning一书），原理性的问题不进行过多的探讨。**Deep Learning中参数初始化十分重要，一般来说有以下这些原因：** 1.初始点的选取，有时候能够决定算法是否收敛 2.当收敛时，初始点可以决定学习收敛的多快，是否收敛到一个代价高或低的点 3.初始化也可以影响泛化 4.初始参数需要破坏不同神经元间的“对称性”，因为

CNN数值初始化——xavier（下）

zhongshaoyy的博客

10-28

6189

作者：冯超链接：https://zhuanlan.zhihu.com/p/22044472 来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。上回说到我们从前向的方向推导，发现了这些0均值的随机变量在计算过程中会产生方差扩散的问题，我们并且从前向的方向给出了解决的办法。既然在刚才的句子中我们反复提到了前向这两个字，那肯定是在别有用心地告诉大家——还有后

参与评论您还未登录，请先登录后发表或查看评论

系统学习深度学习（十四）--权重初始化Xavier

工作笔记

02-27

1万+

“Xavier”初始化方法是一种很有效的神经网络初始化方法，方法来源于2010年的一篇论文《Understanding the difficulty of training deep feedforward neural networks》，可惜直到近两年，这个方法才逐渐得到更多人的应用和认可。为了使得网络中信息更好的流动，每一层输出的方差应该尽量相等。基于这个目标，现在我们就去推导一下：

十五天掌握CNN——可视化理解CNN、CNN优缺点、参数初始化、过拟合

尹江 _ Cecil

11-09

1751

魏老师学生——Cecil：学习卷积神经网络CNN之旅可视化理解CNNCNN优缺点参数初始化权重的初始化偏置项的初始化Xavier过拟合可视化理解CNN 保存层级的网络结构。不同层级有不同形式运算和功能。 CNN优缺点优点局部感知的共享卷积核，轻松处理高维参数。特征属性不敏感，特征值通过训练权重得到。通过深层次的网络，可以抽取更丰富的图像信息，具有更好的表达效果。缺...

深度学习之一：CNN初见

luchi007的专栏

02-28

148

语音学习笔记14------卷积神经网络CNN参数说明

菲菲家的吴先森

03-14

1607

由于神经网络中有不同的层结构，不同类型的层又有不同的参数，所有就根据Caffe官网的说明文档做了一个简单的总结。 1. Vision Layers 1.1 卷积层(Convolution) 类型：CONVOLUTION 例子 layers { name: "conv1" type: CONVOLUTION bottom: "data"

笔记（三）——网络中参数访问和初始化

weixin_45169380的博客

12-20

854

在定义好我们的层和类后，参数如何访问呢在训练过程中，我们将需要使用这些参数来做出未来的预测。此外，有时我们希望提取参数，以便在其他环境中复用它们，将模型保存下来，以便它可以在其他软件中执行，或者为了获得科学的理解而进行检查目录参数访问 1、目标参数 2、一次性访问所有函数二、参数初始化 内置的初始化器。参数访问 import torch from torch import nn net = nn.Sequential(nn.Linear(4, 8), nn.ReL...

Tensorflow学习笔记9-卷积神经网络CNN

weixin_40852935的博客

12-03

1171

这里写目录标题什么是卷积神经网络 CNN卷积convolution池化poolingFlatten流程流行的 CNN 结构什么是卷积神经网络 CNN 我们先把卷积神经网络这个词拆开来看. “卷积” 和 “神经网络”. 卷积也就是说神经网络不再是对每个像素的输入信息做处理了,而是图片上每一小块像素区域进行处理, 这种做法加强了图片信息的连续性. 使得神经网络能看到图形, 而非一个点. 这种做法同时也加深了神经网络对图片的理解. 具体来说, 卷积神经网络有一个批量过滤器, 持续不断的在图片上滚动收集图片里的信

学习笔记：深度学习（3）——卷积神经网络（CNN）理论篇

最新发布

m0_51579041的博客

04-20

421

【深度学习实战（12）】搭建训练框架之模型参数初始化

深度学习参数设置-CNN

qq_33278461的博客

07-19

8725

训练技巧： 1.数据增强：翻转，随机尺寸变换，裁剪，位置偏移，颜色抖动。优点：可以提高网络泛化能力。 2.预处理：零均值化(中心化)和标准化(归一化)：取消由于量纲不同、自身变异或者数值相差较大所引起的误差。优点：标准化加速梯度下降速度(加速收敛)、有可能提高精度。零均值化：相当于平移到中心(0，0)，变量减去均值。标准化：使得不同的特征具有相同的尺度(Scale)...

pytorch 搭建神经网络CNN的 初始化 set_seed ()

qq_41901755的博客

04-21

7082

第一步，设置种子随机数在神经网络中，参数默认是进行随机初始化的。不同的初始化参数往往会导致不同的结果，当得到比较好的结果时我们通常希望这个结果是可以复现的，在pytorch中，通过设置随机数种子可以达到这个目的。 def set_seed(seed): torch.manual_seed(seed) # cpu 为CPU设置种子用于生成随机数，以使得结果是确定的 torch.c...

Tensorflow学习（3）参数初始化

楠国的鱼

11-18

4811

CNN中最重要的就是参数了，包括W,b。我们训练CNN的最终目的就是得到最好的参数，使得目标函数取得最小值。参数的初始化也同样重要，因此微调受到很多人的重视，那么tf提供了哪些初始化参数的方法呢，我们能不能自己进行初始化呢？所有的初始化方法都定义在tensorflow/python/ops/init_ops.py 1、tf.constant_initializer()也可以简写为tf.Con

神经网络中参数的初始化方法

Well~

01-20

7253

昨天做完了coursera上ng神经网络课程的第一节第四周作业，终于完整地实现了一个深层神经网络。当我准备整理一下思路和代码，写一个自己的神经网络时（其实就是copy代码），问题来了。我的代码的训练结果与课程作业中的结果差别很大：左边是作业中的结果，右边是我自己的结果，显然我的结果有问题。在梯度下降过程中，我的代价函数一直保持在0.6几，似乎陷入了局部最优解（不知道是不是这个原因），而在左...

深度学习笔记：CNN卷积神经网络解析

然而，sigmoid在接近饱和区时容易出现梯度消失的问题，而tanh的平均输出为0，可能对模型初始化有利。相比之下，ReLU函数在负区直接输出0，正区保持原值，它的线性性质避免了梯度消失问题，且计算效率更高，因此在卷...