特点
相比其他目标检测任务,文本目标的长宽比变化大、具有方向性(弯曲)
一、 趋势
1、矩形->四边形
2、英文->多语言
3、端对端->语义、NLP
二、归类
1. 基于回归
CPTN:FRCN+LSTM,空间+时序,优点:边缘准;缺点:标签制作麻烦、模型框架设计复杂
text boxes系列:SSD + 3*3,单类, 多尺度
RRPN
2. 基于分割
应用于弯曲文本
SOTD:文字、边界、背景,3分类
PSENET:shrink解决粘连
DB:学习二值化的阈值,Scoremap边界
3. 基于回归+分割
优点:任意形状,召回,多尺度
缺点:相邻重叠,极大、极小,完整
maskRCNN
mask textSpotter(端对端)
PMTD:softmax分割图
SPCNet
4. 基于分割+回归
east系列
textSnake
textPerpeption