论文阅读笔记（5-1）---Stage-wise Training: An Improved Feature Learning Strategy for Deep Models

最新推荐文章于 2022-04-14 17:55:24 发布

打着灯笼摸黑

最新推荐文章于 2022-04-14 17:55:24 发布

阅读量409

点赞数

分类专栏：心电图分类文章标签：神经网络深度学习人工智能计算机视觉机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39594939/article/details/115599444

版权

心电图分类专栏收录该内容

17 篇文章 28 订阅

订阅专栏

分阶段学习

Definition
Stage-wise Information Evolution
Experiments

Definition

分阶段的培训框架是将训练数据的信息逐渐呈现给网络。在训练早期，网络只能访问一部分数据，特别是数据的粗尺度特性，使得网络在粗尺度上提取特征，然后网络学习更精细的信息，并且从一千的阶段学习特征提取器从而获得更好的预测。也就是说，每个阶段提取的特征都是下一阶段特征提取的先决条件。
在这里插入图片描述
神经网络的训练是一个基于梯度的优化过程。这种训练策略通常存在梯度扩散问题，随着网络深度的增加，反向传播的梯度会迅速消失，因此，顶层学习速度最快。此外，由于只有分类层有足够多的自由度，所以分类层比特征提取层更容易过度拟合。因此，在任何阶段性的训练中，只对特征提取曾进行前一阶段的初始化。
在这里插入图片描述

Stage-wise Information Evolution

在已有的阶段学习框架中，传递给每个阶段的训练信息是逐步演化的，可实现方法如下：

输入域 $x_s$ 的逐步进阶
输出域 $y_s$ 的逐步进阶
训练集 $T_s$ 的逐步进阶

本文使用的是第一张方法。
在这里插入图片描述

Experiments

实验使用标准的CIFAR10数据集，该数据集由10类32×32彩色图像组成，每类对象具有50000个训练样本和10000个测试样本。为了信息进阶，每个训练图像以S=5进行子采样。

对于阶段性训练，网络结构在训练过程中保持不变，我们使用两层卷积层，filters为64，卷积核大小为5×5，后面跟着非线性激活层和池化层stride为2，pool_size为3×3。第一层和第二层分别使用最大池化层和平均池化层。

打着灯笼摸黑

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
论文阅读笔记（5-1）---Stage-wise Training: An Improved Feature Learning Strategy for Deep Models

分阶段学习DefinitionStage-wise Information EvolutionExperimentsDefinition分阶段的培训框架是将训练数据的信息逐渐呈现给网络。在训练早期，网络只能访问一部分数据，特别是数据的粗尺度特性，使得网络在粗尺度上提取特征，然后网络学习更精细的信息，并且从一千的阶段学习特征提取器从而获得更好的预测。也就是说，每个阶段提取的特征都是下一阶段特征提取的先决条件。神经网络的训练是一个基于梯度的优化过程。这种训练策略通常存在梯度扩散问题，随着网络深度的增加，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。