CRNN骨干网络替换指南

最新推荐文章于 2023-12-14 18:31:06 发布

mochp

最新推荐文章于 2023-12-14 18:31:06 发布

阅读量2.5k

点赞数 1

分类专栏： OCR 文章标签：计算机视觉 python 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mochp/article/details/114259381

版权

OCR 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

CRNN骨干网络替换指南

CRNN自2015年发表至今，仍然是OCR领域霸榜的存在。但当时所用的骨干网络直接早已落后于现在的AUTOML搜索，比如：mobilenetv3,efficientnet。如何将这些新型网络应用于CRNN呢，掌握本博客介绍的原则，轻松替换你的CRNN骨干网络。

文章目录

CRNN骨干网络替换指南
前言
一、CRNN的骨干网络设计
二、实战部分
- 1. 基于mobilenetv3的CRNN
- 2. 基于efficientnet的CRNN
总结

前言

修改CRNN骨干网络前，需要具备一个常识，自Vgg网络开始，所有的特性提取网络都有以下两个步骤：

1、5次下采样。
2、flatten、pooling、linear等操作输出最终类别

拿经典的Resnet为例，输入尺寸224×224，经过5次下采样缩减为7×7(224/32)特征图 ,最后经过AdaptiveAvgPool2d、linear操作输出最终类别

一、CRNN的骨干网络设计

首先看CRNN的骨干网络设计：
crnn网络结构
如图所示，模型输入为32×320的图像，输出为1×81的特征图，其中高度部分一共下采样5次（5个红色框），宽度部分只在前两次进行下采样（2个绿色框）。

基于此设计准则，我们就可以愉快地修改我们自己的CRNN特征提取网络了，我们要做的就是将所选的骨干网络，
1、倒数后3次的stride由2改为（2,1）
2、删除采样后面的pooling、linear等操作

二、实战部分

1. 基于mobilenetv3的CRNN

mobilenetv3没有官网实现，高星实现: mobilenetv3为基础模型。
如下图红框部分所示，将倒数3个s 由2改为（2,1）
在这里插入图片描述

2. 基于efficientnet的CRNN

efficientnet没有官网实现，高星实现: efficientnet为基础模型
如下图红框部分所示，将倒数3个s 由s22改为s21

总结

到此就可以回答很多初入ocrer的高频问题：模型训练时，训练样本最大字符个数是多少？欢迎交流讨论~

关注

1
点赞
踩
21

收藏

觉得还不错? 一键收藏
4
评论
CRNN骨干网络替换指南

CRNN骨干网络替换指南 CRNN自2015年发表至今，仍然是OCR领域霸榜的存在。但当时所用的骨干网络直接早已落后于现在的AUTOML搜索，比如：mobilenetv3,efficientnet。如何将这些新型网络应用于CRNN呢，掌握一个原则，轻松替换你的CRNN骨干网络。文章目录CRNN骨干网络替换指南前言一、CRNN的骨干网络设计二、修改骨干网络1. 修改为resnet2. 修改为mobilenet3. 修改为efficientnet总结前言提示：这里可以添加本文要记录的大概内容：
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。