自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

我的博客

原创 CS231N-L1与L2正则化

L1、L2正则化均能惩罚值较大的参数，并且能够选择权重的偏好，让权重、模型更加简单。可以看出，加入L2正则化项的损失函数在训练时倾向将参数训练的更均匀和分散。L1正则化与Dropout作用有异曲同工之处，可使网络具有稀疏性。含有很多值为0的权重的网络，具有稀疏性，稀疏性可以防治过拟合。可以通过简单的二元函数来理解，待我复试之后来补之~

2024-03-20 19:39:55 159 1

原创 CS231N-优化器

AdaGrad中学习率分母是历史梯度的平方和，会无限增大，我们采用动量的思想对其修改，这样他的历史梯度就不会无限增大导致学习率下降。在这个公式下，历史梯度越大的特征Gt会越大，因此历史梯度越大的特征的学习率会下降越快。由于随着梯度增加，分母越来越大，学习率不断衰减甚至接近0，因此Adagrad后期的学习率非常小，容易学习困难。为不同参数设置不同的学习率，避免手动去调整学习率，减缓大梯度的更新速度，加快小梯度的更新速度。其中，参数 β 为动量因子。他结合了两者的优势，在学习率和梯度上都应用的动量的思想。

2024-03-20 22:14:26 454 1

原创 CS231N-Batch Normalization（批量归一化）

并且由于参数的更新，每层输入分布都在发生变化，导致网络很难收敛，为了让网络可以正常训练，就需要。神经网络研究人员发现，这个现象是由于每层分布的差异过大，并且无法预测导致的，那么如果让每一个batch样本在每一层都服从类似的分布，就可以解决这样的问题。我们不希望每层的分布都相同，因此我们增加了一个线性运算γ和β，γ和β是作为参数进行学习的，如果学习得当当伽马等于标准差，β等于期望时，y就是x的恒等映射。统计所有批次的均值时，每次更新均值时，1-m乘以过去的均值再加上m乘以当前批次的均值。

2024-03-20 21:29:40 160

原创 CS231N-权重初始化

为了让输出y的方差落在一个可控的范围内，例如让他等于1，这样求出参数w分布的方差就等于1/n，假设有n个输入。零初始化可能会导致对称问题，所有参数不仅初始化的值是一样的，而且训练过程中的变化也是一样的，一层中的神经元状态会始终保持一致，没有办法学习和表达更复杂的特征。如果使用双曲正切函数作为激活函数，那么又可能因为y的值过大或过小而得到一个非常小的梯度，这样反而会造成梯度消失的问题。当我们不使用任何激活函数的时候，放大的y值就会被累积在反向传播的过程里，这样就会造成梯度爆炸。

2024-03-20 21:23:57 482

原创 CS231N-激活函数

把w1*w2看成一个参数w3，那么y2=w3x还是一个线性输出，没什么用。比如说一个二分类问题，如果使用不使用激活函数，那么他的决策边界只能是。若使用了激活函数，以sigmoid为例，就可以实现。如果不使用非线性激活函数，那么。激活函数可以实现非线性划分。

2024-03-20 21:00:33 294

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

锟斤考烫烫烫 CSDN认证博客专家 CSDN认证企业博客

码龄4年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

5: 原创

190万+: 周排名

14万+: 总排名

1475: 访问

: 等级

90: 积分

28: 粉丝

36: 获赞

2: 评论

22: 收藏

私信

关注

热门文章

最新评论

CS231N-L1与L2正则化
CSDN-Ada助手: 恭喜你开始了博客创作！标题中提到了CS231N-L1与L2正则化，这是一个非常有趣的话题。希望你能继续深入探讨这个主题，可以结合具体的案例或者实际应用来展开讨论。同时，也建议你可以尝试扩展一下，探讨一些其他与正则化相关的内容，比如交叉验证、模型选择等，这样可以让你的博客内容更加丰富和全面。加油！期待你的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
CS231N-激活函数
CSDN-Ada助手: 非常棒的博客！你对CS231N中激活函数的解释清晰明了，让人受益匪浅。希望你可以继续分享更多关于深度学习的知识和经验。另外，在深度学习领域，了解不同激活函数的特点和适用场景也是非常重要的，比如ReLU、Leaky ReLU、Tanh等，它们各有特点，选择合适的激活函数可以提高模型性能。期待你未来的文章能够涉及更多这方面的内容，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
CS231N-权重初始化
CSDN-Ada助手: 恭喜你发布了第三篇博客！对于CS231N的权重初始化这一话题进行了探讨，非常有深度和价值。接下来，建议可以继续深入研究相关主题，比如梯度消失和梯度爆炸等问题，或者尝试结合实际案例进行分析和探讨。期待你更多精彩的创作！加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
CS231N-Batch Normalization（批量归一化）
CSDN-Ada助手: 恭喜您发布了新的博客！批量归一化是一个很重要的主题，能够有效提高神经网络的训练效果。希望您能继续分享更多关于深度学习和神经网络的知识，也可以考虑深入研究一些前沿的技术或者应用案例，让读者更加全面地了解这个领域。期待您的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
CS231N-优化器
CSDN-Ada助手: 恭喜您在CS231N领域写了第5篇博客！优化器是一个非常重要的主题，您的文章内容相信对读者会有很大帮助。接下来，我建议您可以尝试深入探讨不同优化器的优缺点，并结合具体案例进行分析，这样可以让读者更加深入地理解优化器的原理和应用。期待您的下一篇作品！

最新文章

提示

确定要删除当前文章？

取消删除