集成学习总结

最新推荐文章于 2021-12-20 21:41:57 发布

疯狂的荷兰人学3D视觉

最新推荐文章于 2021-12-20 21:41:57 发布

阅读量378

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/weixin_40920290/article/details/89456114

版权

深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

1 数据层面的集成
- 1.1 测试阶段数据扩充
- 1.2 “简单集成”法
2 模型层面的集成

历届kaggle竞赛冠军做法，或简单或复杂其最后一步必然是 集成学习，尽管模型已经很强大，但是集成学习往往能够起到锦上添花的作用。一般而言，深度学习的集成有两大层面：

数据层面
模型层面

1 数据层面的集成

1.1 测试阶段数据扩充

训练阶段有若干数据扩充策略，实际上在模型测试阶段也适用，例如：

图像多尺度(multi-scale)
随机扣取(random crop)

以随机扣取为例:

对测试图片可以得到 $n$ 张随机扣取图像，测试阶段只需要用训练好的深度网络模型对 $n$ 张图分别做预测，之后将预测的各类置信度平均作为测试图像最终的测试结果即可。

1.2 “简单集成”法

“简单集成法”是Liu等人提出针对不平衡样本问题的一种简单集成学习解决方案，好处在于模型集成的同时还能缓解数据不平衡带来的问题，具体地说：

对于样本较多的类采取降采样(undersampling)
每次采样数依据样本数量最少的类别而定，这样每类取到的样本数可保持均等

采样结束后，针对每次采样得到的子数据集训练模型，如此采样、训练重复进行多次。最后对测试数据的预测则依据训练得到若干个模型的结果 取平均 / 投票获得。

2 模型层面的集成

2.1 单模型集成

2.1.1 多层特征融合

由于深度卷积神经网络特征具有层次性的特点，不同层特征富含的语义信息可以相互补充。

在诸如下面这些领域常见 多层特征融合策略：

图像语义分割
细粒度图像检索
目标检测

一般地，多层特征融合操作可直接将不同层网络特征 级联(concatenate)，而对于特征融合应选取哪些网络层，一个实际经验是：

最好使用靠近目标函数的几层卷积特征，因为愈深层特征包含的高层语义愈强，分辨能力也愈强。

相反，网络较浅层的特征较普适，用于特征融合反而起不到作用。

2.1.2 网络“快照”集成法

快照集成法 https://blog.csdn.net/qq_14845119/article/details/86509041

我们知道深度神经网络模型复杂的解空间中存在非常多的 局部最优解：

经典 Min-batch SGD

只能收敛到其中一个局部最优解。

网络“快照”集成法

循环调整学习率依次收敛到不同的局部最优解处，利用这些最优解来对单个网络做模型集成。

其差异如下：

具体做法，将网络学习率 $\eta$ 设置为随模型迭代轮数 $t$ 改变的函数：
$\eta \left( t \right)=\frac{{{\eta }_{0}}}{2}\left( \cos \left( \frac{\pi \bmod \left( t-1,\left\lceil T/M \right\rceil \right)}{\left\lceil T/M \right\rceil } \right)+1 \right)$
其中：

${{\eta }_{0}}$ 为初始学习率，一般设置为 0.1 或 0.2
$t$ 为模型迭代轮数
$T$ 为模型总的批处理训练次数
$M$ 为学习率“循环退火”次数，对应于模型将收敛到的局部最优解的个数。

(退火是材料加工的一个特有名词，指将金属加热到某个再结晶温度并维持一段时间，再将其缓慢冷却的过程。这里退火指，网络模型学习率从初始学习率逐渐减缓到0的过程。)