Can You Read Me Now? Content Aware Rectification using Angle Supervision

本文提出了一种名为Folds的方法,它使用角度监督来校正扭曲的文档图像,考虑了文本内容、位置和方向,提高了OCR准确性和几何重建质量。Folds预测文档的3D结构并进行后向映射,通过像素级角度回归损失和曲率估计任务优化校正过程。
摘要由CSDN通过智能技术生成

Can You Read Me Now? Content Aware Rectification using Angle Supervision


Content Aware Rectification using Angle
Supervision)

Abstract

智能手机摄像头的普遍存在已经导致了更多的摄像头和摄像头更多的文件被相机捕捉到,而不是被扫描到。不像平板扫描仪,拍照的文件通常是折叠和弯曲的采样,导致文本结构较大的局部方差大。的问题文档修正是光学字符重建的基础在文件上的认知(OCR)过程,及其克服地理位置的能力度量失真会显著影响识别精度。尽管最近的OCR系统取得了巨大的进展,大多数仍然依赖于预处理以确保文本线是直线和轴对齐的。最近的工作已经解决了纠正文档图像的问题,在野生使用各种监督信号和对齐手段。然而他们关注的是可以从文档中提取的全局特征环境的边界,忽略了各种可以从中获得的信号文档的内容。我们提出了折痕:内容意识校正使用角度超级-视觉,第一个学习的文档修正的方法文件的内容,文字的位置,特别是它们的位置定位,作为提示,以协助整改过程。我们利用一个新的像素级角度回归方法和曲率估计优化我们的修正模型的副任务。我们的方法超过了以往的方法在OCR精度,几何误差和视觉相似性。

Introduction

文档是共享信息和记录交易的一种常见方式人之间。为了使大量的印刷文件数字化硬拷贝是扫描和文本是自动提取的光学字符识别(OCR)系统,如[11,12]。在过去,大多数文件都是这样做的用平板扫描仪扫描。然而,在过去的几年里,已经看到了一个上升使用智能手机,并同时使用智能手机相机作为文档扫描器照相机捕捉到的文件,如收据,通常是折叠的,弯曲的,或褶皱,并在相机角度,照明和纹理条件上变化很大。这使得OCR任务与扫描图像相比更具挑战性。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值