为什么神经网络参数不能全部初始化为全0？

winner8881

已于 2023-06-08 17:34:27 修改

阅读量291

点赞数

文章标签：神经网络深度学习人工智能

于 2023-06-08 17:33:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22866291/article/details/131112479

版权

在这里插入图片描述

简单来说，就会出现同一隐藏层所有神经元的输出都一致，对于后期不同的batch，每一隐藏层的权重都能得到更新，但是存在每一隐藏层的隐藏神经元权重都是一致的，多个隐藏神经元的作用就如同1个神经元。

这样总结来看：w初始化全为0，会导致每一隐藏层的隐藏神经元权重都是一致，很可能直接导致模型失效，无法收敛。

因此可以对w初始化为随机值解决（在cnn中，w的随机化，也是为了使得同一层的多个filter，初始w不同，可以学到不同的特征，如果都是0或某个值，由于计算方式相同，可能达不到学习不同特征的目的）

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
为什么神经网络参数不能全部初始化为全0？

w初始化全为0，会导致每一隐藏层的隐藏神经元权重都是一致，很可能直接导致模型失效，无法收敛。
复制链接

扫一扫

winner8881 CSDN认证博客专家 CSDN认证企业博客

码龄10年

159: 原创

4万+: 周排名

1万+: 总排名

11万+: 访问

: 等级

2008: 积分

92: 粉丝

78: 获赞

54: 评论

322: 收藏

私信

关注

热门文章

分类专栏

召回 1篇
工具 6篇
推荐系统 14篇
Java 1篇
微服务 1篇
运维 25篇
大数据 16篇
sql 7篇
机器学习 31篇
数据挖掘 21篇
硬件电路 4篇
数据结构 20篇

最新评论

强化学习 Q-learning 算法举例
winner8881: 注意，1号和4号都可以走出房间，是把外面的所有部分都当成了房间5，所以4不仅可以转移到0,3，也可以转移到5
一文搞懂 AB Testing 的分层分流
winner8881: 如何保证精排不受到重排的影响？这是一个挖坑的问题，因为精排和重排是流量分层且正交的，当然不会收到影响，一般来说，分层从上到下依次是：召回层、精排层、重排层。
DeepFM梳理
winner8881: FM 用隐向量的方式不需要特征共线都可以训练，提高了泛化能力，可以让没有同时出现的特征学好。
Attention中的Q、K、V
winner8881: 2、Q、K、V attention是transformer的核心所在。
Attention中的Q、K、V
winner8881: 1、了解Q、K、V后再会看bert，再会看bert就非常简单。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。