pse文本行检测_AI论技 | PSENet在票据文本检测中的应用

最新推荐文章于 2024-02-02 18:27:47 发布

CodeMaster

最新推荐文章于 2024-02-02 18:27:47 发布

阅读量255

点赞数

文章标签： pse文本行检测

本文链接：https://blog.csdn.net/weixin_26846533/article/details/112246972

版权

PSENet，全称Progressive Scale Expansion Network，是一种形状鲁棒的文本检测网络，尤其适用于处理任意形状的文本。通过渐进式尺度扩展算法，PSENet能精确检测和区分邻近文本，有效解决传统方法在文本粘连时的误识别问题。该模型在CTW1500、Total-Text等数据集上表现出高检测性能，尤其适合票据等场景的文本检测。

摘要由CSDN通过智能技术生成

导

读

在计算机视觉领域，OCR是一个基础且关键的研究方向。随着学术界的不断探索和技术不断成熟，OCR也开始在互联网及其他行业逐步上线使用，应用范围也从文档识别扩展到照片分析、车牌识别，场景理解，商品识别，街景定位，票据识别等更广泛的领域。但是自然场景中的文本字符往往存在任意的形状，格式，间距，这也给学术研究的实际落地带来了不小的挑战，近年来随着渐进式扩展网络(PSENet)横空出世，以另一种思路解决了这些问题，下面我们来梳理一下该模型在票据文本检测中的应用，不妥之处敬请指正。

本文作者

谷阿幻

品览研发部

视觉算法工程师

计算机视觉与图像处理领域

两年算法经验

东北电力大学

【PSENet】，全称Shape Robust Text Detection with Progressive Scale Expansion Network，即渐进尺度扩展的形状鲁棒文本检测网络。共有两个版本，最新的版本是2019年的CVPR接收的一篇由南京大学和face++合作的文章。

PSENet是一种基于语义分割的方法，用于检测任意方向的文本，并且采用了渐进式尺度扩展算法用来区分邻近的文本块。因此，该网络可以精确地检测任意形状的文本，并且准确地将文本实例紧密地分开。

背景介绍

近年来，文本检测领域的深度学习方法主要包括以下几类：基于候选框的文本检测(Proposal-based)，基于分割的文本检测(Segmentation-based)，基于两者混合的文本检测(Hybrid-based)，以及其他方法的文本检测。对于基于候选框的文本检测，其

最低0.47元/天解锁文章

CodeMaster

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pse文本行检测_AI论技 | PSENet在票据文本检测中的应用

导读在计算机视觉领域，OCR是一个基础且关键的研究方向。随着学术界的不断探索和技术不断成熟，OCR也开始在互联网及其他行业逐步上线使用，应用范围也从文档识别扩展到照片分析、车牌识别，场景理解，商品识别，街景定位，票据识别等更广泛的领域。但是自然场景中的文本字符往往存在任意的形状，格式，间距，这也给学术研究的实际落地带来了不小的挑战，近年来随着渐进式扩展网络(PSENet)横空出世，以另一...
复制链接

扫一扫