逻辑回归和神经网络权重初始化为0的问题

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/qq_38383549/article/details/83960168

本文是基于吴恩达神经网络视频的课后题的做题总结与笔记
课后题如下:

https://blog.csdn.net/u013733326/article/details/79827273

逻辑回归与神经网络的关系:
逻辑回归可以看作是只有个神经元的单层神经网络,神经网络就是一组神经元连接在一起的网络,隐藏层可以有多个神经元,每个神经元本身就对应着一个逻辑回归过程。

神经网络的权重不能全为0的原因:
神经网络的权重w 的不同代表输入的向量有不同的特征,即权重越大的特征越重要,比如在人脸识别中,人脸的属性有眼睛,鼻子,嘴巴,眉毛,其中眼睛更能够影响人脸的识别,所以我们给与眼睛更大的权重。

如果将权重初始化全为0,那么隐藏层的各个神经元的结果都是一样的,从而正向传播的结果是一样的,反向传播求得的梯度也是一样的,也就是说不管经过多少次迭代,更新的w(i)是相同的,这样就判断不了哪个特征比较重要了。

因此,初始w不同,可以学到不同的特征,如果都是0或某个值,由于计算方式相同,可能达不到学习不同特征的目的。

逻辑回归的权重可以初始化为0的原因:
Logistic回归没有隐藏层。 如果将权重初始化为零,则Logistic回归中的第一个示例x将输出零,但Logistic回归的导数取决于不是零的输入x(因为没有隐藏层)。 因此,在第二次迭代(迭代发生在w和b值的更新中,即梯度下降)中,如果x不是常量向量,则权值遵循x的分布并且彼此不同。

                                </div>
            <link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-1fe1ed04d7.css" rel="stylesheet">
                </div>
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值