论文阅读： Character Region Awareness for Text Detection （CRAFT）

最新推荐文章于 2024-08-15 09:55:00 发布

qian99

最新推荐文章于 2024-08-15 09:55:00 发布

阅读量7.1k

点赞数 6

分类专栏：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qian99/article/details/90740430

版权

本文介绍了CRAFT论文，该方法针对文本检测问题，利用分割策略，包含字符中心概率和字符连接关系的回归。网络基于VGG16，训练数据采用概率热力图，弱监督学习用于处理标注困难，后处理使用连通域分析提取边界框。

摘要由CSDN通过智能技术生成

简介

论文链接：https://arxiv.org/abs/1904.01941

这篇论文的主要是解决文本检测的问题，思路是利用分割的方法，与图像分割有些不同的是，CRAFT不是对整个图像进行像素级分类，而是做了回归，它有两个分支，一个是目标是字符的中心的概率（这里用概率可能不是很准确，或许说是距离字符中心的距离更好一些），另一个是字符之间的连接关系，然后经过一步后处理，得到文本的边界框。

网络结构

CRAFT的网络结构如图。看起来并不复杂，基于VGG16的结构，整体类似UNet，是一个标准的分割模型。Region Score表示该点是文字中心的概率，Affinity Score可以认为是该点是两个字之间的中心的概率。这个结构还是比较简单的，其实大部分基于分割的模型网络结构都比较简单，主要是后处理与训练数据。

在这里插入图片描述

训练数据格式

CRAFT的训练数据label不是二值化的图像，而是采用了类似热力图的的图像，这也对应了上面说的，表示的是该位置在文字中心的概率。

在这里插入图片描述

上图是训练数据的labe

最低0.47元/天解锁文章

关注

6
点赞
踩
22

收藏

觉得还不错? 一键收藏
8
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。