一、概要
最终目的:在开发板上部署一个快速的文字检测模型,并且可以达到实时准确检测的效果
算法名称:轻量PANNet文字检测算法,具体可以通过前面的博客PAN网络简介进行细节了解。
二、网络修改思路
原始的PANNet网络可以检测多行(几十个文字)、紧凑的文字,而本文的算法处理内容要简单很多,因为需要检测的文字是单行且简短的,如下图所示
如上面的这种列车车厢外侧的车厢编号。
所以,所需要的PanNet网络,是不必像原始网络那样需要用到kernel核和embedding向量进行像素聚合处理流程的。所以网络的输出只需要一个通道的text预测即可,如网络input_size=[1,3,24,120],输出为output=[1,1,24,120]。
注意!其中的FPEM模块,只需要两个分支进行特征融合。
三、网络搭建
1. 网络整体结构
如上图所示,主干网络主要采用了Resnet50或Resnet101等残差网络中用到的BottleNeck结构,FPEM只用到了主干网络的两个分支的输出,在输出端只有一个Text的预测部分,output=[bx1x24x120]。