文本检测

特点
相比其他目标检测任务,文本目标的长宽比变化大、具有方向性(弯曲)


一、 趋势
1、矩形->四边形
2、英文->多语言
3、端对端->语义、NLP

 

二、归类
1. 基于回归
CPTN:FRCN+LSTM,空间+时序,优点:边缘准;缺点:标签制作麻烦、模型框架设计复杂
text boxes系列:SSD + 3*3,单类, 多尺度
RRPN


2. 基于分割

应用于弯曲文本

SOTD:文字、边界、背景,3分类
PSENET:shrink解决粘连
DB:学习二值化的阈值,Scoremap边界
    
 3. 基于回归+分割
优点:任意形状,召回,多尺度
缺点:相邻重叠,极大、极小,完整

maskRCNN

mask textSpotter(端对端)

PMTD:softmax分割图

SPCNet

 

4. 基于分割+回归

east系列

textSnake

textPerpeption
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值