datawhale组队学习CV记录五

模型集成
1.集成学习的方法
机器学习中常见的集成学习方法有:
1)Stacking
2)Bagging
3)Boosting
在10个CNN模型可以使用如下方式进行集成:
1) 对预测的结果的概率值进行平均,然后解码为具体字符;
2) 对预测的字符进行投票,得到最终字符。
2.深度学习中的集成学习
1)Dropout:
在每个训练批次中,通过随机让一部分的节点停止工作。同时在预测的过程中让所有的节点都作用。
2)TTA(测试集数据扩增):
数据扩增不仅可以在训练时候用,而且可以同样在预测时候进行数据扩增,对同一个样本预测三次,然后对三次结果进行平均
3)Snapshot:
使用cyclical learning rate进行训练模型,并保存精度比较好的一些checkopint,最后将多个checkpoint进行模型集成。由于在cyclical learning rate中学习率的变化有周期性变大和减少的行为,因此CNN模型很有可能在跳出局部最优后进入另一个局部最优。此种方法可以在一定程度上提高模型精度,但需要更长的训练时间。
3.结果后处理
本次比赛的题目可以从两个思路来对测试结果进行处理:
1)统计图片中每个位置字符出现的频率,使用规则修正结果
2)单独训练一个字符长度预测模型,用来预测图片中的字符个数,修正结果。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值