自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 神经网络权重为什么不初始化为0?

1. 对称性破坏:如果所有权重都初始化为0,那么在前向传播和反向传播的过程中,每一层的所有神经元将接收到相同的输入和梯度更新,导致它们更新后的权重依然相同。这种情况下,无论网络有多少层或多少神经元,每一层的所有神经元都会执行相同的操作,相当于网络没有多个神经元的学习能力。因为在反向传播过程中,接近0的权重会导致梯度也接近0,使得权重难以更新(梯度消失);如果权重初始化为0,那么无论输入数据如何,激活函数的输入总是0,这将使得激活函数的输出在一开始是固定值,从而无法通过梯度下降进行有效的学习。

2024-04-01 12:40:06 275

原创 如何解释深度学习中模型过拟合的现象

2. 如果训练集和测试集之间的准确率差异显著,特别是如果这种差异随着训练时间的增长而增大,这可能是过拟合的信号。的定义:指的是模型在训练数据上学习得太好,以至于把训练集中的一些噪声或随机波动也当作了有效特征,导致模型在新的、未见过的数据上表现不佳。1.由于测试集是模型之前未见过的数据,因此训练集上的准确率通常会比测试集上的准确率稍高。3. 如果训练时间过长,没有适当的提前停止机制(early stopping),模型可能会继续学习训练数据中的噪声,从而导致过拟合。

2024-03-31 10:24:34 271

原创 深度学习中一直弄不清楚的概念总结

1、batch_size=1(每次只训练一个样本)

2023-02-09 17:38:30 57 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除