OCR
文章平均质量分 84
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
本专栏主要介绍各种常用OCR,以及分享特殊情况或需求下的OCR解决方案
Watermelo617
一个giser,coder,noder,要做最好的前端工程师,但java、docker、数据库、python什么都学什么都做
展开
-
使用OCR库Pix2Text执行p2t.recognize()时出现list index out of range的错误信息(附有Pix2Text识别图片内容和laTex公式的代码)
1、如何通过python使用Pix2Text识别图片。2、使用Pix2Text识别图片时出现list index out of range的错误信息的原因及解决方案原创 2024-03-23 15:19:47 · 1056 阅读 · 2 评论 -
对双栏 | 单双栏混合 | 图表文字混合的复杂布局的图片OCR识别(对布局复杂的整个pdf进行OCR识别)
1、解决对布局复杂的论文PDF进行OCR识别的难点。2、解决常规OCR识别会导致双列布局被识别为一列从而结果混乱的问题。原创 2024-03-28 22:02:14 · 1091 阅读 · 0 评论