零基础入门CV实践-Task5
任务简介
模型集成
学习目标:
1、学习集成学习方法以及交叉验证情况下的模型集成
2、学会使用深度学习模型的集成学习
集成学习方法
常见的集成学习方法:Stacking,Bagging,Boosting
集成学习方法有时也被称作多分类器系统,感觉就是通过使用多个分类器的方式来提升学习效果的一个方法。
根据个体学习器的生成方式,目前的集成学习方法大致可以分为两类:
个体学习器间存在强依赖关系、必须串行生成的序列化方法,代表为Boosting;
个体学习器间不存在强依赖关系、可同时生成的并行化方法,代表为Bagging和随机森林。
出处
留取法:需要较好的硬件设备
交叉验证法:有较好的精度
深度学习中的集成学习
1、Dropout
随机停掉一部分节点,可以有效缓解模型过拟合,并增加模型精度
2、TTA
测试集数据扩增(Test Time Augmentation)
是常用的集成学习技巧(数据扩增在预测的时候也可以进行),对同一个样本预测三次,然后对三次结果进行平均
3、Snapshot
结果后处理
本次比赛的预测结果后处理思路
1、统计图片中每个位置字符出现的频率,使用规则修正结果
2、单独训练一个字符长度预测模型,用来预测图片中字符个数,并修正结果