【动手学学学】卷积神经网络 [Period 3]

最新推荐文章于 2020-11-13 18:00:00 发布

天上的星星数不清

最新推荐文章于 2020-11-13 18:00:00 发布

阅读量145

点赞数

文章标签： pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40150765/article/details/104328218

版权

Task06：批量归一化和残差网络；凸优化；梯度下降（1天）

批量归一化

对输入的标准化（浅层模型）：处理后的任意一个特征在数据集中所有样本上的均值为0、标准差为1。
标准化处理输入数据使各个特征的分布相近

批量归一化（深度模型）：利用小批量上的均值和标准差，不断调整神经网络中间输出，从而使整个神经网络在各层的中间输出的数值更稳定。

稠密连接网络（DenseNet）

稠密块（dense block）：定义了输入和输出是如何连结的。
过渡层（transition layer）：用来控制通道数，使之不过大。

「过渡层」
1×1 卷积层：来减小通道数
步幅为2的平均池化层：减半高和宽

凸优化

尽管优化方法可以最小化深度学习中的损失函数值，但本质上优化方法达到的目标与深度学习的目标并不相同。

优化方法目标：训练集损失函数值
深度学习目标：测试集损失函数值（泛化性）

Task07：优化算法进阶；word2vec；词嵌入进阶（1天）

优化算法进阶

Exponential Moving Average 「指数加权移动平均」
指数加权平均，作为原数据的估计值，不仅可以 1. 抚平短期波动，起到了平滑的作用，2. 还能够将长线趋势或周期趋势显现出来。
Momentum、RMSprop、Adam中都涉及到指数加权平均这个概念。

RMSProp
Adam
Adagrad
SGD Momentum

词嵌入进阶

GloVe 全局向量的词嵌入: 通过等价转换 Word2Vec 模型的条件概率公式，我们可以得到一个全局的损失函数表达，并在此基础上进一步优化模型

Task08：文本分类；数据增强；模型微调（1天）

数据增强

应对过拟合问题，在数据量较小的数据集中十分常用

文本分类

模型微调

fine tuning

在源数据集（如ImageNet数据集）上预训练一个神经网络模型，即源模型。
创建一个新的神经网络模型，即目标模型。它复制了源模型上除了输出层外的所有模型设计及其参数。我们假设这些模型参数包含了源数据集上学习到的知识，且这些知识同样适用于目标数据集。我们还假设源模型的输出层跟源数据集的标签紧密相关，因此在目标模型中不予采用。
为目标模型添加一个输出大小为目标数据集类别个数的输出层，并随机初始化该层的模型参数。
在目标数据集（如椅子数据集）上训练目标模型。我们将从头训练输出层，而其余层的参数都是基于源模型的参数微调得到的。

天上的星星数不清

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【动手学学学】卷积神经网络 [Period 3]

Task06：批量归一化和残差网络；凸优化；梯度下降（1天）Task07：优化算法进阶；word2vec；词嵌入进阶（1天）Task08：文本分类；数据增强；模型微调（1天）...
复制链接

扫一扫

天上的星星数不清 CSDN认证博客专家 CSDN认证企业博客

码龄7年

7: 原创

29万+: 周排名

87万+: 总排名

2818: 访问

: 等级

90: 积分

1: 粉丝

1: 获赞

2: 评论

6: 收藏

私信

关注

热门文章

最新评论

MacOS下的basemap工具包安装
enchanted_z: 如果没有报错的话也可以不加这个环境变量对吧我发现我的好像又没问题了呜呜这一步是帮助找到basemap的吗
MacOS下的basemap工具包安装
enchanted_z: 您好～最后一步在import前加入环境变量的地址是谁的地址哦用的mac一时之间不知道这个环境变量怎么写

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。