深度学习
文章平均质量分 79
帅翰GG
这个作者很懒,什么都没留下…
展开
-
C2-2.1 Mini-batch 梯度下降
,比如这里有5000万个训练样本,由于一次性对这些训练样本进行训练拟合模型,会发生训练速度过慢的情况 / 完全训练不了因为数据量太大了,对内存 GPU都是一个考验。。。提高运算速度。内存不足的情况。和之间找到平衡,使得处理大型数据集成为可能,同时也利用了现代计算硬件的并行处理能力。原创 2024-04-10 15:41:13 · 710 阅读 · 0 评论 -
C2-1.4(L1,L2)正则化
如λ取1000时,损失函数的值受正则化影响,为了减小J(w,b)最终的值,就尽量减少 w值,如λ取0时,损失函数的值就导致了不受正则化的影响,就变成了以前那样的函数。外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传。首先来复习一下**“正则化”公式:**最终 f(x) ≈ b。为了防止过拟合,线性回归的。原创 2024-02-22 17:15:31 · 539 阅读 · 0 评论 -
C2-1.6 Dropout正则化——提高泛化能力
以图一为例:假设在训练图一所示的神经网络,它存在(模型过于复杂情况),dropout(每一层设置的阈值不同),并。假设每个节点得以保留和消除的概率都是0.5。设置完节点概率会消除一些节点,然后删除掉从该节点进出的连线,目的:随机消除一些神经元,让网络规模更小,模型变得相对简单一些。原创 2024-02-22 17:13:19 · 1168 阅读 · 0 评论 -
C1-3.4 多个样本的向量化
输入X,x的个数为m,就是m列的向量。1、把多组输入变量X拼接在一起2、通过计算得出多样本向量化Z。原创 2024-01-13 10:08:31 · 447 阅读 · 0 评论 -
C1-3.2 关于‘神经网络’
【注释】彩色图像(RGB)由三原色构成,二维图像在任意一个点像素为立体三层结构,分别是红色、绿色、蓝色值,该值的范围在0∽255之间。原创 2024-01-13 10:04:00 · 960 阅读 · 0 评论