神经网络权重初始化问题

最新推荐文章于 2022-12-28 17:56:36 发布

bingfeiqiji

最新推荐文章于 2022-12-28 17:56:36 发布

阅读量445

点赞数

在神经网络中，权重基本上是要随机初始化的。有以下一些问题

权重不能全部设为0
• 每个神经元都有着相同的输出，在反向传播时具有相同的梯度
一个神经网络的层中的权重值很小，那么在反向传播的时候就会计算出非常小的梯度（因为梯度与权重值是成比例的）。这就会很大程度上减小反向传播中的“梯度信号
解决方案：校准方差，除以1/sqrt(n)：
• w = np.random.randn(n) / np.sqrt(n)
• ReLU:w = np.random.randn(n) * np.sqrt(2/n)
b的初始化
• 通常设为0 (不是1，手动笑，以前一直以为是1，，)
• 有些设为如0.01的小值
• 这样做能让所有的ReLU单元一开始就激活，这样就能保存并传播一些梯度

这里没有加转载链接，是因为上述文字，我从别人做的ppt上看到的，自己做了一些改动而已，因此没有链接。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
神经网络权重初始化问题

在神经网络中，权重基本上是要随机初始化的。有以下一些问题权重不能全部设为0 • 每个神经元都有着相同的输出，在反向传播时具有相同的梯度一个神经网络的层中的权重值很小，那么在反向传播的时候就会计算出非常小的梯度（因为梯度与权重值是成比例的）。这就会很大程度上减小反向传播中的“梯度信号解决方案：校准方差，除以1/sqrt(n)： • w = np.random.ra...
复制链接

扫一扫

bingfeiqiji CSDN认证博客专家 CSDN认证企业博客

码龄7年

37: 原创

5万+: 周排名

77万+: 总排名

26万+: 访问

: 等级

2059: 积分

49: 粉丝

158: 获赞

58: 评论

445: 收藏

私信

关注

热门文章

最新评论

用python调用R程序出现的问题 2018-8-25
2301_81671120: 大佬您好！请问使用了您的解决办法之后程序报错NotImplementedError: Conversion 'py2rpy' not defined for objects of type '<class 'type'>'，这应该怎么解决呢
Rejection Sample（拒绝采样）
白色纯度: 个人理解：model就是未知分布p(x)，需要通过采样拟合。但是需要满足 p(x) < M* q(x)，代码中的 L_gauss其实就是 q(x) ，p(x) 设计为两个正态分布的加权平均，为了满足拒绝采样的条件而已。 [code=python] import numpy as np import seaborn as sns import math class Rejection_Sample(object): """ n: 采样样本数量 k: 拒绝采样中的 M, 常数 model：需要拟合的分布 """ def __init__(self, sample_number, k_constant, p_distribution): self.sample_number = sample_number self.k_constant = k_constant self.p_distribution = p_distribution self.sample=self.rejection_sample() def q_function(self, miu=1.4, sigma=1.2): sample_function_list = np.random.normal(miu, sigma, self.sample_number) # 采样函数 q_gauss_density = 1 / (math.sqrt(2 * math.pi) * sigma) * np.exp(-np.power((sample_function_list - miu), 2) / (2 * sigma ** 2)) # 上限函数 return sample_function_list, q_gauss_density def rejection_sample(self): sample_function_list, q_density = self.q_function() sample_result=[] count=0 [/code]
cmake编译时出现问题：CMake Error: The source.. does not match the soused to generate cache. Re-run cmake..
sjwlovecy: 删除了还是不行啊，不知道什么原因
pyinstaller 打包流程大体说明（linux）
qq_34595138: 大佬你的/build.sh文件中写的命令都是怎么写的？
web of science 数据库都包括哪些？
qq_42954817: wos里有个scie，能搜索到就是sci，也就是高质量期刊，其他都不算

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。