利用OCR文本识别工具进行表单识别 文字识别

表单识别已经经过验证可行的python代码。

使用OpenCV进行图片处理,校正,二值化,去噪等。

对表单的边框进行识别划分表格,实现输出的文件和输入的位置对应。

1.EasyOCR

EasyOCR是支持70多种语言的OCR,包括中文,日文,韩文和泰文等。对中文的识别准确率很不错。

调用了EasyOCR库进行文字识别需要数据集。可以自动下载

pip install easyocr

但有下不成功的可能,也可以下载数据集之后放到指定位置。

文字检测模型(CRAFT)(必须)

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/craft_mlt_25k.zip

中文(简体)模型(识别中文必须)

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese_sim.zip

中国(传统)模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese.zip

拉丁模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/latin.zip

日本模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/japanese.zip

韩文模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/korean.zip

泰文模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/thai.zip

阿拉伯文模型

https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/arabic.zip

下载完模型后,将文件放到下面这个位置。

Windows:C:\Users\用户名.EasyOCR\model
Linux:~/ .EasyOCR / model
 

需要额外下载EasyOCR库的中文数据集。

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
Master PDF Editor 专业的PDF编辑工具中文正式版,Master PDF Editor是简易用的应用程序,用于处理具有强大多功能功能的PDF文档。使用Master PDF Editor,您可以轻松查看,创建和修改PDF文档。该应用程序允许您在多个文件合并成一个,分割源文档分成多个文件,并且还评论,签名和加密PDF files.View,创建,修改,签署,扫描,OCR和打印PDF文档。 Master PDF Editor 修改文字和对象 使用Master PDF Editor,您可以将任何格式的文本添加到PDF文档或编辑现有文本。您还可以将图像插入文档,选择和移动对象,更改对象的大小,将图像保存到文件并将对象复制到剪贴板。 注释PDF文档 强大的注释工具(如便签,测量工具和形状)以及删除线,下划线和突出显示功能提供的增强的编辑功能将使您的工作比以往任何时候都更加轻松。创建独特的图章,并在审阅文档或记录其状态时使用它们。 创建并填写PDF格 使用Master PDF Editor,可以很容易地编辑交互式PDF的各种元素,例如按钮,文本字段,复选框等,以及为预定义的用户操作实现事件处理程序。支持使用JavaScript进行自动计算和数据验证。 光学字符识别 光学字符识别使您能够快速有效地搜索文本,以及编辑扫描的文档和包含图像的文档。 PDF页面上的操作 Master PDF Editor支持合并和吐出PDF文件。它使您能够轻松地移动,删除,插入和旋转PDF文档中的页面以及更改其大小。 PDF书签 创建,编辑和删除书签。为指定的页面或段落添加书签,以允许快速的文档导航和有效地查找信息。 虚拟PDF打印机 Master PDF Editor安装为虚拟PDF打印机,使您可以轻松地从支持打印的不同应用程序(ed Microsoft Word / Excel,OpenOffice)中打印任何文档。 数字签名 检查数字签名,创建新的数字签名并使用数字证书签署文档。对于PDF文档,数字签名与纸质文档上的手写签名等效,因此,签名文档的收件人可能会对其真实性充满信心。 创建PDF文件 可以使用扫描仪直接从纸质文档创建PDF。Master PDF Editor允许您从现有文件创建文档,创建空白文档或将空白页插入现有文档。 软件官方网站地址 https://code-industry.net/masterpdfeditor 修改中文:左上角Tools > settings > Language > Chinese-Simplified

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

& # &

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值