街景字符识别-task5-模型集成

最新推荐文章于 2024-08-13 14:31:48 发布

secker123

最新推荐文章于 2024-08-13 14:31:48 发布

阅读量173

点赞数

分类专栏：街景识别文章标签：深度学习

本文链接：https://blog.csdn.net/secker123/article/details/106504299

版权

本文探讨了深度学习中用于提高预测精度的集成学习方法，包括10折交叉验证集成的CNN模型、Dropout技术以减轻过拟合、TTA测试集数据扩增以及Snapshot Ensembles。通过模型平均、字符投票和结果后处理，可以提升街景字符识别的准确性。集成学习虽能提高精度，但需权衡训练时间和成本。

摘要由CSDN通过智能技术生成

集成学习方法

在机器学习中的集成学习可以在一定程度上提高预测精度，常见的集成学习方法有Stacking、Bagging和Boosting，同时这些集成学习方法与具体验证集划分联系紧密。
由于深度学习模型一般需要较长的训练周期，如果硬件设备不允许建议选取留出法，如果需要追求精度可以使用交叉验证的方法。
下面假设构建了10折交叉验证，训练得到10个CNN模型。
在这里插入图片描述
那么在10个CNN模型可以使用如下方式进行集成：

对预测的结果的概率值进行平均，然后解码为具体字符；
对预测的字符进行投票，得到最终字符。

深度学习中的集成方法

此外在深度学习中本身还有一些集成学习思路的做法，值得借鉴学习：

Dropout

Dropout可以作为训练深度神经网络的一种技巧。在每个训练批次中，通过随机让一部分的节点停止工作。同时在预测的过程中让所有的节点都其作用。

Dropout经常出现在先有的CNN网络中，可以有效的缓解模型过拟合的情况，也可以在预测时增加模型的精度。

加入Dropout后的网络结构如下：

# 定义模型
class SVHN_Model1(nn.Module):
    def __init__(self):
        super(SVHN_Model1, self).__init__()
        # CNN提取特征模块
        self.cnn = nn.Sequential(
            nn.Conv2d(3, 16, kernel_size=(3, 3), stride=(2, 2)),
            nn.ReLU(),
            nn.Dropout(0.25),
            nn.MaxPool2d(2

最低0.47元/天解锁文章

secker123

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
街景字符识别-task5-模型集成

模型集成集成学习方法深度学习中的集成方法DropoutTTASnapshot结果后处理集成学习方法在机器学习中的集成学习可以在一定程度上提高预测精度，常见的集成学习方法有Stacking、Bagging和Boosting，同时这些集成学习方法与具体验证集划分联系紧密。由于深度学习模型一般需要较长的训练周期，如果硬件设备不允许建议选取留出法，如果需要追求精度可以使用交叉验证的方法。下面假设构建了10折交叉验证，训练得到10个CNN模型。那么在10个CNN模型可以使用如下方式进行集成：对预测的结果
复制链接

扫一扫