FAST文本检测

FAST: Searching for a Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation文本检测阅读笔记(2111.02394v1.pdf)

解决的问题Question

  • 检测任意形状文本
  • 模型手工设计、非最优、速度慢
  • 精度低

创新点Idea

  • 运用了NAS网络搜索
  • 运用了Connected Components Labeling (CCL)算法,实现用gpu快速后处理得到最终文本位置。

模型结构

backbone+类似残差结构+预测层(head)+Text dilation
在这里插入图片描述

细节

NAS选项中,设计了1*3、3*1的卷积核,有利于长文本,竖排文本检测。
NAS还用identity(表示什么都不加)控制网络规模。
没有使用fpn,直接用类似残差结构进行特征融合
损失使用 1 − 2 p ∗ g p 2 + q 2 1-\frac{2p*g}{p^2+q^2} 1p2+q22pg,取自基本不等式,pq分别是预测和真实,同时综合了内核和text的损失。

实验

比较多个模型,绘速度精度图。
文本核收缩大小对结果的影响的实验,测试了最佳文本核收缩大小
在4个数据集上与很多算法比较精度和FPS。

总结

在速度与精度平衡上由于现有算法

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值