【笔记3】动手学深度学习

最新推荐文章于 2023-04-01 01:05:14 发布

轶轶

最新推荐文章于 2023-04-01 01:05:14 发布

阅读量380

点赞数

分类专栏：知识点

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40510182/article/details/104488765

版权

资料来源：伯禹学习平台。

批量归一化 BatchNormalization和残差网络：

批量归一化的作用：

1、对输入标准化，使各个特征分布相近，更加容易训练出有效模型

2、批量归一化：深层模型接近输出层数据变化剧烈，BN使各层输出更稳定

批量归一化应用位置：应用在全连接或卷积层之后，激活函数之前

BN在训练时：

全连接层是对mxd个值做批量归一化；卷积层是对mxpxq个值做批量归一化，输出的每个通道分别做批量归一化

BN在预测时：用移动平均的方法估算整个数据集样本的均值和方差

移动平均：moving_mean | var = momentum * moving_mean | var + (1-momentum) * mean | var

ResNet

输入可以通过跨层通道更快前向传播

易于捕捉恒等映射的细微波动

DenseNet

和残差网络结构类似，差别在于不是输出和输入求和，而是输出和输入通道数进行concat

包括稠密块和过渡层两部分，稠密块最终的输出维度是in_channels + num_conv*out_channels，过渡层则是通过1x1卷积层减少通道数避免通道数过高

凸优化：

优化方法目标和深度学习的目标不一致：

优化方法：训练集损失函数值

深度学习：测试集损失函数值

优化在深度学习中的挑战：局部最小值、鞍点(一二阶导都为0)

海森矩阵：多变量函数所有二次偏导数组成的矩阵

鞍点以及局部最值与海森矩阵的关系：在一些偏导数为零的点，

如果海森矩阵特征值都为正数，就是局部最小值点

如果海森矩阵特征值都为负数，就是局部最大值点

如果海森矩阵特征值有正有负就是鞍点(函数图像从一个方向看是局部最大值，从另一个方向看是局部最小值)

梯度消失：函数梯度很平稳很小，优化过程非常慢

凸性：

凸集合中任意两点连线上所有点都在集合内

凸集合的交集还是凸集合

凸集合的并集不一定是凸集合

凸函数定义：

凸函数，非凸函数，凸函数

Jensen不等式：

函数值的期望>=期望的函数值

凸函数性质：

1、无局部最小值

2、凸集：Sb={x|x∈X and f(x) ≤ b}

3、凸函数和二阶导数：f’’(x) ≥ 0 <=> f(x)是凸函数

有限制条件的函数优化：

1、拉格朗日乘子法

2、加入惩罚项

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【笔记3】动手学深度学习

批量归一化 BatchNormalization和残差网络：批量归一化的作用：1、对输入标准化，使各个特征分布相近，更加容易训练出有效模型2、批量归一化：深层模型接近输出层数据变化剧烈，BN使各层输出更稳定批量归一化应用位置：应用在全连接或卷积层之后，激活函数之前BN在训练时：全连接层是对mxd个值做批量归一化；卷积层是对mxpxq个值做批量归一化，输出的每个通...
复制链接

扫一扫

专栏目录

轶轶 CSDN认证博客专家 CSDN认证企业博客

码龄7年

8: 原创

27万+: 周排名

146万+: 总排名

2万+: 访问

: 等级

351: 积分

5: 粉丝

7: 获赞

3: 评论

30: 收藏

私信

关注

分类专栏

配置 2篇
知识点 2篇
安利 1篇
分享 1篇

最新评论

服务器新手操作入门
蜗牛259: 这个一点也不新手，我也是废人了
服务器新手操作入门
小何@126: 看不懂啊看不懂+1
服务器新手操作入门
喵喵giao？？: 我废了，光是入门我就看不懂

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。