EAST文本检测算法

EAST文本检测算法(1704.03155.pdf)

1704表明2017年4月发表

解决的问题Question

  • 多方向文本检测
  • 模型复杂阶段多、速度慢
  • 精度低

创新点Idea

  • 设计了一个简洁的模型结构:全卷积、不包括冗余和缓慢的中间步骤

模型结构

backbone+U型结构+预测层(得分,2点加倾斜角度/4点)
在这里插入图片描述

细节与经典句子

细节

使用FPN(U型结构),
生成标签时往内收缩0.3的长宽
得分损失–平衡交叉熵损失:
在这里插入图片描述
两点损失–IOU损失
倾斜角度损失–1-cos(o1-o2)
四点损失–八个数对应差的绝对值。
非文本像素数目/全部像素数目
在这里插入图片描述
Locality-Aware NMS:合并框框,而不是去除,遍历每一个框,如果能和前面合并就合并,否则把前面的加入到ans,把这个作为当前准备合并的框

句子

  1. The core of text detection is the design of features to distinguish text from backgrounds. Traditionally,features are manually designed to capture the properties of scene text, while in deep learning based methods effective features are directly learned from training data.
  2. In most state-of-the-art detection pipelines, training images are carefully processed by balanced sampling and hard negative mining to tackle with the imbalanced distribution of target objects

实验

设置了三个backbone,PVANET,PVANET2x,VGG16。
1、展示特征图
2、展示结果
3、三个数据集三个backbone两种输出层比较结果精度。
4、比较速度fps

总结与展望

1、以后可以研究弯曲文本
2、检测识别集成
3、进军一般目标检测

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值