阿里云天池竞赛-零基础入门CV赛事-Task5 模型集成

最新推荐文章于 2022-01-26 10:39:27 发布

Enthusiasmoo

最新推荐文章于 2022-01-26 10:39:27 发布

阅读量325

点赞数

分类专栏：竞赛文章标签：机器学习计算机视觉深度学习

本文链接：https://blog.csdn.net/pwh1209/article/details/106521759

版权

本博客介绍了机器学习中的集成学习方法，如Stacking、Bagging和Boosting，并探讨了深度学习中的集成策略，如Dropout、TTA和Snapshot。通过10折交叉验证训练10个CNN模型，通过平均概率值或投票来集成预测结果。Dropout用于防止过拟合，TTA在预测时增强数据，而Snapshot利用周期性学习率保存多个模型 checkpoint 进行集成。此外，还讨论了结果后处理策略，如字符频率统计和长度预测模型，以提高预测准确性。

摘要由CSDN通过智能技术生成

5 模型集成

本章讲解的知识点包括：集成学习方法、深度学习中的集成学习和结果后处理思路。

5.1 学习目标

学习集成学习方法以及交叉验证情况下的模型集成
学会使用深度学习模型的集成学习

5.2 集成学习方法

在机器学习中的集成学习可以在一定程度上提高预测精度，常见的集成学习方法有Stacking、Bagging和Boosting，同时这些集成学习方法与具体验证集划分联系紧密。

由于深度学习模型一般需要较长的训练周期，如果硬件设备不允许建议选取留出法，如果需要追求精度可以使用交叉验证的方法。

下面假设构建了10折交叉验证，训练得到10个CNN模型。
在这里插入图片描述

那么在10个CNN模型可以使用如下方式进行集成：

对预测的结果的概率值进行平均，然后解码为具体字符；
对预测的字符进行投票，得到最终字符。

5.3 深度学习中的集成学习

此外在深度学习中本身还有一些集成学习思路的做法，值得借鉴学习：

5.3.1 Dropout

Dropout可以作为训练深度神经网络的一种技巧。在每个训练批次中，通过随机让一部分的节点停止工作。同时在预测的过程中让所有的节点都其作用。
在这里插入图片描述
Dropout经常出现在在先有的CNN网络中，可以有效的缓解模型过拟合的情况，也可以在预测时增加模型的精度。

加入Dropout后的网络结构如下：

# 定义模型
class SVHN_Model1(nn.Module):
    def __init__(self):
        super(SVHN_Model1, self).__init__()
        # CNN提取特征模块
        self.cnn = nn.Sequential(
            nn.Conv2d(3, 16, kernel_size=(3, 3), stride=(2, 2)),
            nn.ReLU(),
            nn.Dropout