深度学习优化——He初始化

最新推荐文章于 2024-03-06 18:03:40 发布

NPC_0001

最新推荐文章于 2024-03-06 18:03:40 发布

阅读量5k

点赞数 3

分类专栏： deep learning 文章标签：深度学习神经网络机器学习

本文链接：https://blog.csdn.net/talkAC/article/details/121769642

版权

He初始化由何凯明等人提出，适用于Relu和Prelu激活函数，旨在解决神经网络中梯度消失问题，保证信息在前向和反向传播中的有效流动，确保各层输入信号方差均衡。与标准差0.01的初始化相比，He初始化在深层网络中表现更优。

摘要由CSDN通过智能技术生成

1 背景

He初始化是何凯明等提出的一种鲁棒的神经网络参数（W）初始化方法，可以保证信息在前向传播和反向传播过程中能够有效流动，使不同层的输入信号的方差大致相等。

He初始化对应的是非线性激活函数（Relu 和 Prelu）。

2 方法

任意层的权重 $W_{l}$ ，按照均值为 0，且方差为 $\sqrt{\frac{2}{n_{l}}}$ 的高斯分布进行初始化，可以保证每一层的输入方差尺度一致。

def initialize_parameters_he(layers_dims):
    np.random.seed(3)
    parameters = {}
    L = len(layers_dims) # 网络层数 
    for l in range(1, L):
        parameters['W'+str(l)] = np.random.randn(layers_dims[l],layers_dims[l-1])*np.sqrt(2./layers_dims[l-1])
        parameters['b'+str(l)] = np.zeros((layers_dims[l],1))  
    return parameters

parameters = initialize_parameters_he([2, 4, 1])
print("W1 = " + str(parameters[&

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

NPC_0001

关注关注

3
点赞
踩
23

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

从零实现深度学习框架——几种常用的权重初始化方法

日积月累，天道酬勤

04-21

2384

近两万字详细解释Xavier初始化和He初始化的由来，并有详尽的推理证明！

深度学习之参数初始化（二）——Kaiming初始化

热门推荐

CodeTutor

06-13

3万+

。

参与评论您还未登录，请先登录后发表或查看评论

深度学习中的He初始化

gaoxueyi551的专栏

02-19

6913

一、背景 He初始化是何凯明等提出的一种鲁棒的神经网络参数初始化方法，动机同Xaviar初始化基本一致，都是为了保证信息在前向传播和反向传播过程中能够有效流动，使不同层的输入信号方差大致相等。二、一些假设关于参数的大部分假设同Xaviar初始化一致，但是，He初始化对应的是非线性激活函数（Relu 和 Prelu），而Xaviar初始化对应的是线性激活函数。符号假设参考原论文。三、推导 ...

深度学习的初始化Initialization

elfighting的博客

01-30

620

Coursera深度学习的初始化Initialization

神经网络参数初始化-He初始化

u010505915的博客

06-11

6314

Glorot和Bengio提出了Xavier方法来初始化网络参数。该方法基于激活是线性的假设。但该假设对ReLU不适用。何凯明（He kaiming）在论文《Delving Deep into Rectifiers:Surpassing Human-Level Performance on ImageNet Classification》中提出了针对 ReLU激活网络的初始化方法。 He初始化与Xavier方法一样，He初始化方法也希望初始化使得正向传播时，状态值的方差保持不变；反向传播时，关于激活.

人工智能系列实验（四）——多种神经网络参数初始化方法对比（Xavier初始化和He初始化）

qq_43734019的博客

09-12

2266

本实验利用Python，搭建了一个用于区分不同颜色区域的浅层神经网络。通过使用三种不同的初始化方法：全0初始化、随机初始化和He初始化，比较改变初始化方法对最终预测效果的影响。实验原理：为什么要初始化权重权重初始化的目的是防止在深度神经网络的正向传播过程中层激活函数的输出损失梯度出现爆炸或消失。如果发生任何一种情况，损失梯度太大或太小，就无法有效地向后传播，并且即便可以向后传播，网络也需要花更长时间来达到收敛。全0初始化全0初始化是最差的初始化方法，只适用于单神经元神经网络，如人工智能系列实验（一

Xavier初始化和He初始化

xxy_的博客

11-22

2万+

Xavier初始化：条件：正向传播时，激活值的方差保持不变；反向传播时，关于状态值的梯度的方差保持不变。 初始化方法： W∼U[−6ni+ni+1,6ni+ni+1]W\sim U[-\frac{\sqrt6}{\sqrt{n_i+n_{i+1}}},\frac{\sqrt6}{\sqrt{n_i+n_{i+1}}}]W∼U[−ni+ni+16,ni+ni+16] 假设...

神经网络权值初始化之Xavier和He初始化

It’s All Uphill From Here

08-03

1212

Xavier初始化: 条件：正向传播时，激活值的方差保持不变；反向传播时，关于状态值的梯度的方差保持不变。 初始化方法：假设激活函数关于0对称，且主要针对于全连接神经网络。适用于tanh和softsign 论文地址：Understanding the difficulty of training deep feedforward neural networks 参考资料：深度学习之参数初始化（一）——Xavier初始化 He初始化：论文地址：Delving Deep into Rectifier

Course 2 改善深层神经网络 Week 1 零初始化、随机初始化和抑梯度异常初始化（He initialization）

Reanon的博客

08-22

831

抑梯度异常初始化 2上一层的维度\sqrt{\frac{2}{\text{上一层的维度}}}上一层的维度2 L2正则化避免过度拟合的标准方法称为L2正则化，它包括适当修改你的成本函数，我们从原来的成本函数(1)到现在的函数(2)： (1)J=−1m∑i=1m(y(i)log⁡(a[L](i))+(1−y(i))log⁡(1−a[L](i)))J = -\frac{1}{m} \sum\lim...

deeplearning.ai第二门课——权重初始化

10-11

He初始化则是针对ReLU激活函数设计的，它的方差是Xavier初始化的两倍，因为ReLU激活函数的一半时间输出为0，导致前向传播的方差减半。 2. **归一化初始化**：另一种常见方法是将权重初始化为单位范数，如Orthogonal...

深度学习之参数初始化（一）——Xavier初始化

qq_37764129的博客

05-31

4605

我们需要牢记参数初始化的目的是为了让神经网络在训练过程中学习到有用的信息，这意味着参数梯度不应该为0。而我们知道在全连接的神经网络中，参数梯度和反向传播得到的状态梯度以及入激活值有关——激活值饱和会导致该层状态梯度信息为0，然后导致下面所有层的参数梯度为0；入激活值为0会导致对应参数梯度为0。所以如果要保证参数梯度不等于0，那么参数初始化应该使得各层激活值不会出现饱和现象且激活值不为0。我...

Ex、En和He初始值

tudizu的专栏

05-18

1000

relu-sigmoid-xavier-He-初始化-偏向性-图

轻宇的博客

10-16

1275

总结一下： relu-std=0.01-初始化-偏向性大 relu-xavier-初始化-偏向性 relu-He-初始化-无偏向性 # -*- coding: utf-8 -*- """ Created on Tue Oct 15 11:54:48 2019 @author: qy """ import numpy as np import matplotlib.pyplot as p...

深度学习入门-权重初始值(Xavier,He初始值，隐藏层激活函数值的分布)

泥签的博客

02-14

3211

Xavier初始值，He初始值，std=0.01，神经网络初始值问题讨论比较

weixin_45116749的博客

02-15

402

常见的参数初始化方法

bestxyj的专栏

08-08

1万+

常见的参数初始化方法我们常见的几种初始化方法是按照“正态分布随机初始化——对应为normal”和按照“均匀分布随机初始化——对应为uniform”，这里就不再多说了，这里介绍几种遇见较少的初始化方法。 1、Glorot初始化方法（1）正态化的Glorot初始化——glorot_normal Glorot 正态分布初始化器，也称为 Xavier 正态分布初始化器。它从以 ...

深度学习神经网络中权重的初始化

夜雨飘零

04-15

1万+

目录目录前言模型函数零初始化 随机初始化 He初始化总结参考资料前言良好的初始化权重有以下的好处：加快梯度下降的收敛速度增加梯度下降收敛到较低训练（和泛化）错误的几率所以一个良好的初始化也是非常重要的，这里尝试三种初始化化方式：零初始化，将权重参数初始化为零。随机初始化，使用随机的方式，初始化权重参数。 He初始化，这个公式的初始化方式。...

深度学习模型九大经典初始化方案