【深度学习】

feifeikon

于 2024-08-16 22:21:57 发布

阅读量195

点赞数 1

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/feifeikon/article/details/141271060

版权

梯度消失和梯度爆炸（解释意思，分析产生原因）

在反向传播过程中需要对激活函数进行求导，如果导数大于1，那么随着网络层数的增加梯度更新将会朝着指数爆炸的方式增加这就是梯度爆炸。同样如果导数小于1，那么随着网络层数的增加梯度更新信息会朝着指数衰减的方式减少这就是梯度消失。因此，梯度消失、爆炸，其根本原因在于反向传播训练法则，属于先天不足。

请解释什么是batch normal，它有什么作用？

神经网络在训练的时候随着网络层数的加深,激活函数的输入值的整体分布逐渐往激活函数的取值区间上下限靠近,从而导致在反向传播时低层的神经网络的梯度消失。而Batch Normalization的作用是通过规范化的手段,将越来越偏的分布拉回到标准化的分布,使得激活函数的输入值落在激活函数对输入比较敏感的区域,从而使梯度变大,加快学习收敛速度,避免梯度消失的问题。

BN层的作用是把一个batch内的所有数据，从不规范的分布拉到正态分布。这样做的好处是使得数据能够分布在激活函数的敏感区域，敏感区域即为梯度较大的区域，因此在反向传播的时候能够较快反馈误差传播。

增大batch size应该增大还是减小学习率？

增大。增大batch size相当于见到的样本更多，波动更小，可以增大学习率，加快收敛速度。

给一个三层神经网络(一个输入层，一个隐藏层，一个输出层)，手推一下反向传播算法。

重点关注链式求导法则，sigmoid函数求导。

什么是过拟合，欠拟合

过拟合：训练集上损失很小，测试集上测试效果很差。

欠拟合：欠拟合是指模型拟合程度不高，数据距离拟合曲线较远，或指模型没有很好地捕捉到数据特征，不能够很好地拟合数据。

正则项的作用，什么是L1,L2正则。它们的区别

防止过拟合。

L1是模型各个参数的绝对值之和； L1会趋向于产生少量的特征，而其他的特征都是0，产生稀疏权重矩阵； L2是模型各个参数的平方和的开方值。 L2会选择更多的特征，这些特征都会接近于0，当最小化||w||时，就会使每一项趋近于0，防止过拟合

什么是SGD

什么是GAN？

生成器，判别器。能讲出大致思路。

分类问题评价指标

精准，召回，F1等，解释含义。

AUC、ROC

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【深度学习】

过拟合：训练集上损失很小，测试集上测试效果很差。欠拟合：欠拟合是指模型拟合程度不高，数据距离拟合曲线较远，或指模型没有很好地捕捉到数据特征，不能够很好地拟合数据。防止过拟合。L1是模型各个参数的绝对值之和；L1会趋向于产生少量的特征，而其他的特征都是0，产生稀疏权重矩阵；L2是模型各个参数的平方和的开方值。L2会选择更多的特征，这些特征都会接近于0，当最小化||w||时，就会使每一项趋近于0，防止过拟合生成器，判别器。能讲出大致思路。分类问题评价指标精准，召回，F1等，解释含义。AUC、ROC。
复制链接

扫一扫

feifeikon CSDN认证博客专家 CSDN认证企业博客

码龄3年

82: 原创

12万+: 周排名

3万+: 总排名

3万+: 访问

: 等级

896: 积分

356: 粉丝

62: 获赞

7: 评论

58: 收藏

私信

关注

热门文章

最新评论

代码随想录 day44 完全背包
看着夕阳敲代码: 博主写的非常好，文章干货满满，三联+关注！欢迎作者闲暇之余能回关我的博客进行指导，谢谢！
代码训练营第二天
CSDN-Ada助手: 非常棒的博客！看到你不断学习和思考的态度，我非常受鼓舞。关于这个题目，我想补充一些相关的知识，比如关于动态规划的思想和技巧，以及如何更好地理解二维矩阵。希望这些能对你的学习和成长有所帮助！继续加油，期待你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
二刷数组总结
CSDN-Ada助手: 恭喜您又写了一篇优秀的博客！通过您的总结，我也学到了很多关于数组的知识。希望您能继续保持创作的热情，为我们带来更多精彩的内容。下一步，建议您可以尝试深入探讨数组在实际应用中的使用，或者结合其他数据结构进行比较分析，让读者更加深入地了解数组的优缺点。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
代码训练营第三天
CSDN-Ada助手: 恭喜您写下了第四篇博客，这样的努力是值得赞赏的。在您的博客中，您描述了代码训练营的第三天，这让读者更好地了解了您的学习进程。在接下来的创作中，我建议您可以尝试分享一些自己的实践经验，或者是对所学知识的一些深入探讨。期待您的下一篇博客！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
代码训练营第6天
CSDN-Ada助手: 恭喜您完成了代码训练营第6天的学习并分享了您的心得体会。持续不断地创作和分享对于个人的成长和学习来说是非常重要的，希望您能够继续坚持下去。同时，建议您在下一篇博客中可以围绕学习中遇到的问题和解决方案进行探讨和分享，这样能够更好地帮助到其他读者，也能够锻炼自己的表达和思考能力。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。