2020-AAAI-华科白翔-DBNet文本检测

DBNet是一种用于实时场景文字检测的网络,它引入了可学习的自适应二值化,提高了对阈值变化的鲁棒性。文章采用了MobileNetv3作为骨干网络,并结合FPN获取多尺度特征。经过卷积和转置卷积层,生成预测概率图和阈值图,最终实现近似二值化的文字检测。而CRNN则用于后续的文字识别阶段。
摘要由CSDN通过智能技术生成

文字检测用DBNet,文字识别用CRNN

2020-AAAI-华科白翔-Real-time Scene Text Detection with Differentiable Binarization

做文字检测(基于分割的方法)

目前文字检测算法可以大致分为两类:基于回归的方法和基于分割的方法。
DBNet属于基于分割的方法。
https://blog.csdn.net/michaelshare/article/details/108811236

本文的最大创新点。在基于分割的文本检测网络中,最终的二值化map都是使用的固定阈值来获取,并且阈值不同对性能影响较大。本文中,对每一个像素点进行自适应二值化,二值化阈值由网络学习得到,彻底将二值化这一步骤加入到网络里一起训练,这样最终的输出图对于阈值就会非常鲁棒。
https://zhuanlan.zhihu.com/p/94677957

第一模块:使用CNN网络,对输入图像提取特征,得到特征图,本实验使用的骨干网络是轻量化网络MobileNetv3,同时使用了FPN结构,获取多尺度的特征,在本实验中,我们提取4个不同尺度下的特征图做拼接。
第二模块:使用一个卷积层和两个转置卷积层的结构获取预测的概率图和阈值图;
第三模块:使用DB方法获取近似二值图。
https://paddlepedia.readthedocs.io/en/latest/tutorials/computer_vision/OCR/OCR_Detection/DBNet.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

WX Chen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值