pse文本行检测_AI论技 | PSENet在票据文本检测中的应用

PSENet,全称Progressive Scale Expansion Network,是一种形状鲁棒的文本检测网络,尤其适用于处理任意形状的文本。通过渐进式尺度扩展算法,PSENet能精确检测和区分邻近文本,有效解决传统方法在文本粘连时的误识别问题。该模型在CTW1500、Total-Text等数据集上表现出高检测性能,尤其适合票据等场景的文本检测。
摘要由CSDN通过智能技术生成

在计算机视觉领域,OCR是一个基础且关键的研究方向。随着学术界的不断探索和技术不断成熟,OCR也开始在互联网及其他行业逐步上线使用,应用范围也从文档识别扩展到照片分析、车牌识别,场景理解,商品识别,街景定位,票据识别等更广泛的领域。但是自然场景中的文本字符往往存在任意的形状,格式,间距,这也给学术研究的实际落地带来了不小的挑战,近年来随着渐进式扩展网络(PSENet)横空出世,以另一种思路解决了这些问题,下面我们来梳理一下该模型在票据文本检测中的应用,不妥之处敬请指正。

本文作者

谷阿幻

品览研发部

视觉算法工程师

计算机视觉与图像处理领域

两年算法经验

东北电力大学

9be7dee8d0f05096fdf5df41a30b95f2.png

 【PSENet】,全称Shape Robust Text Detection with Progressive Scale Expansion Network,即渐进尺度扩展的形状鲁棒文本检测网络。共有两个版本,最新的版本是2019年的CVPR接收的一篇由南京大学和face++合作的文章。

PSENet是一种基于语义分割的方法,用于检测任意方向的文本,并且采用了渐进式尺度扩展算法用来区分邻近的文本块。因此,该网络可以精确地检测任意形状的文本,并且准确地将文本实例紧密地分开。

背景介绍

近年来,文本检测领域的深度学习方法主要包括以下几类:基于候选框的文本检测(Proposal-based),基于分割的文本检测(Segmentation-based),基于两者混合的文本检测(Hybrid-based),以及其他方法的文本检测。对于基于候选框的文本检测,其

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值