单排上王者的梅梅-CSDN博客

原创神经网络权重为什么不初始化为0？

1. 对称性破坏：如果所有权重都初始化为0，那么在前向传播和反向传播的过程中，每一层的所有神经元将接收到相同的输入和梯度更新，导致它们更新后的权重依然相同。这种情况下，无论网络有多少层或多少神经元，每一层的所有神经元都会执行相同的操作，相当于网络没有多个神经元的学习能力。因为在反向传播过程中，接近0的权重会导致梯度也接近0，使得权重难以更新（梯度消失）；如果权重初始化为0，那么无论输入数据如何，激活函数的输入总是0，这将使得激活函数的输出在一开始是固定值，从而无法通过梯度下降进行有效的学习。

2024-04-01 12:40:06 275

原创如何解释深度学习中模型过拟合的现象

2. 如果训练集和测试集之间的准确率差异显著，特别是如果这种差异随着训练时间的增长而增大，这可能是过拟合的信号。的定义：指的是模型在训练数据上学习得太好，以至于把训练集中的一些噪声或随机波动也当作了有效特征，导致模型在新的、未见过的数据上表现不佳。1.由于测试集是模型之前未见过的数据，因此训练集上的准确率通常会比测试集上的准确率稍高。3. 如果训练时间过长，没有适当的提前停止机制（early stopping），模型可能会继续学习训练数据中的噪声，从而导致过拟合。

2024-03-31 10:24:34 271

原创深度学习中一直弄不清楚的概念总结

1、batch_size=1（每次只训练一个样本）

2023-02-09 17:38:30 57 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 神经网络权重为什么不初始化为0？

原创 如何解释深度学习中模型过拟合的现象

原创 深度学习中一直弄不清楚的概念总结

空空如也

空空如也

原创神经网络权重为什么不初始化为0？

原创如何解释深度学习中模型过拟合的现象

原创深度学习中一直弄不清楚的概念总结