![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
OCR
文章平均质量分 84
程序媛一枚~
热爱是最好的学习动力。
Either outstanding or out. (要么出众,要么出局)
展开
-
使用Microsoft认知服务进行文本检测和 OCR
这篇博客将介绍 Microsoft Cognitive Services (MCS) OCR API。尽管与Amazon Rekognition API相比,实现和使用起来稍微困难一些,但Microsoft Cognitive Services OCR API表明它非常强大,并且能够在许多情况下(包括低质量图像)进行OCR文本。在处理低质量图像时,MCS API 大放异彩。通常建议以编程方式检测并丢弃低质量的图像(就像我们在前面的教程中所做的那样)。但是如果发现必须使用低质量图像,则很值得花时间研究如何使原创 2022-10-01 22:00:00 · 887 阅读 · 0 评论 -
使用Python,Tesseract更正文本方向
这篇博客将介绍如何使用 Tesseract 的方向和脚本检测 (OSD) 模式执行自动文本方向检测和更正。OSD模式检测并提供了图像中文本的方向,估计的旋转校正角度和脚本/书写系统。文本方向是指图像中文本的角度(以度为单位)。执行 OCR 时可以通过校正文本方向来获得更高的准确性。另一方面,脚本检测是指文本的书写系统,可以是拉丁语,汉字,阿拉伯语,希伯来语等...原创 2022-07-24 21:30:00 · 2351 阅读 · 0 评论 -
Windows pytesseract image_to_osd Invalid resolution 0 dpi. Using 70 instead. Too few characters报错及解决
Windows pytesseract image_to_osd Invalid resolution 0 dpi. Using 70 instead. Too few characters报错及解决原创 2022-07-21 11:05:52 · 1581 阅读 · 0 评论 -
使用 Amazon Rekognition API 进行文本检测和 OCR
这篇博客将介绍如何 使用Amazon Rekognition API 进行文本检测和 OCR,包括如何创建 Amazon Rekognition密钥、安装boto3(用于调用AWS接口的Python程序包)以及如何实现Python 脚本来调用 Amazon Rekognition API。Amazon Rekognition OCR API 结果不仅正确,而且还可以在行和单词级别解析结果,提供了比 EAST文本检测模型和 Tesseract OCR引擎更精细的粒度(至少无需微调多个选项)。原创 2022-10-01 22:30:00 · 865 阅读 · 3 评论 -
使用Tesseract和OpenCV构建自动收据扫描仪
这篇博客将介绍如何使用Tesseract和OpenCV构建自动收据扫描仪。将使用OpenCV构建系统的实际图像处理组件,包括:- 检测图像中的收据(边缘检测、轮廓检测、基于弧长和近似的轮廓滤波)- 找到收据的四个角点- 应用透视变换获得收据的自顶向下鸟瞰视图- 使用Tesseract逐行OCR收据- 查看如何选择正确的Tesseract页面分割模式(PSM Page Segmentation Mode)以获得更好的结果的真实应用程序。...原创 2022-07-16 23:30:00 · 542 阅读 · 0 评论 -
使用Python进行名片OCR(识别姓名,职务,电话,Email邮箱)
这篇博客将介绍如何使用Python对名片进行OCR,从名片中提取姓名、职务、电话号码和电子邮件地址。是收据扫描仪OCR的扩展,但具有不同的正则表达式和文本定位策略。**优化:可以利用更先进的文本后处理技术,例如真正的自然语言处理(NLP natural language processing)算法,而不是正则表达式。正则表达式可以很好地用于电子邮件地址和电话号码,但可能无法获得高精度的姓名和职务。...原创 2022-07-16 23:00:00 · 3191 阅读 · 0 评论 -
使用OpenCV和Python,OCR识别数字
这篇博客将演示如何使用OpenCV和Python识别图像中的数字。该方法只适用于七段显示器(通常在数字闹钟上看到 数字显示器)。通过提取七个片段中的每个片段并应用基本阈值和形态学运算,可以确定哪些片段处于“打开”状态,哪些片段处于“关闭”状态。然后,通过在Python字典数据结构中查找开/关段,就可以快速确定实际数字,而无需机器学习!...原创 2021-03-16 18:22:52 · 5564 阅读 · 6 评论 -
Python,OpenCV基于支持向量机SVM的手写数字OCR
上一节介绍了基于KNN的手写数字OCR+字母OCR,这一节将介绍基于支持向量机SVM的手写数字OCR。原创 2021-08-06 20:39:31 · 1010 阅读 · 0 评论 -
使用拼写检查提高Tesseract OCR准确性
上一篇博客介绍了如何使用textblob库和Tesseract自动进行OCR文本,然后将其翻译为其他语言。这篇博客还将通过textblob应用自动拼写检查OCR文本来提高OCR准确性 **(能够使用textblob纠正拼写错误,纠正单词等)**。......原创 2022-07-14 23:33:11 · 1132 阅读 · 0 评论 -
使用Tesseract和Python进行OCR和语言翻译
这篇博客将介绍如何使用Tesseract、Python自动进行OCR和文本翻译。**使用textblob,翻译文本就像单个函数调用一样简单。(textblob翻译底层调用translate.google.com会报超时等,用translators库实现翻译)**原创 2022-07-10 23:30:00 · 586 阅读 · 0 评论 -
使用Python,OpenCV应用EAST文本检测器检测自然场景图像中的文本
使用Python,OpenCV检测自然场景图像中的文本1. 效果图2. 原理2.1 为什么自然场景文本检测如此具有挑战性?3. 源码参考这篇博客将介绍如何使用Python,OpenCV应用EAST文本检测器检测自然场景图像和视频流中的文本。OpenCV的EAST文本检测器是一种深度学习模型,基于一种新颖的体系结构和训练模式。它能够(1)在720p图像上以13 FPS的速度近实时运行,(2)获得最先进的文本检测精度。1. 效果图2. 原理2.1 为什么自然场景文本检测如此具有挑战性?图像/传感器原创 2022-07-09 22:00:00 · 1714 阅读 · 0 评论 -
使用Python,OpenCV+OCR检测护照图像中的机器可读区域(MRZ Machine-Readable Zones)
这篇博客将介绍如何只使用基本的图像处理技术(例如阈值处理,形态运算和轮廓属性)来检测护照图像中的机器可读区域(MRZ Machine-Readable Zones (MRZs))。原创 2021-02-06 19:37:11 · 1410 阅读 · 0 评论 -
使用Tesseract OCR引擎和层次聚集聚类(HAC)对多列数据进行OCR
这篇博客将介绍如何使用Tesseract OCR引擎和层次聚集聚类(HAC)对多列数据进行OCR。包括学习一些OCR多列数据的提示和技巧,最重要的是,将文本的行/列关联在一起。原创 2022-06-11 11:30:00 · 797 阅读 · 4 评论 -
Python,OpenCV中的光学字符识别OCR文章汇总
Python,OpenCV中的光学字符识别(OCR Optical Character Recognition)使用Python,OpenCV+OCR检测护照图像中的机器可读区域(MRZ Machine-Readable Zones)Python,OpenCV基于支持向量机SVM的手写数字OCRPython,OpenCV使用KNN来构建手写数字及字母识别OCRWindows下命令行及Java+Tesseract-OCR对图像进行(字母+数字原创 2022-04-17 15:51:20 · 557 阅读 · 0 评论 -
使用Python,OpenCV进行银行支票数字和符号的OCR
这一篇将介绍如何使用Python,OpenCV从支票图像中提取OCR银行账户和路由号码(数字和符号)。原创 2021-08-29 22:27:17 · 2133 阅读 · 6 评论 -
使用Python,OpenCV进行卡类型及16位卡号数字的OCR
这篇博客将介绍如何通过OpenCV和Python使用模板匹配执行光学字符识别(OCR)。具体来说,将使用Python+OpenCV实现模板匹配算法,以自动识别卡的类型和以及16位卡号数字。原创 2021-08-28 23:42:42 · 5096 阅读 · 19 评论 -
使用Python,OpenCV进行Tesseract-OCR绑定及识别
上一篇博客介绍了Windows上Tesseract-OCR的安装,并使用命令行参数进行了OCR数字和字母的识别。这一篇将介绍如何使用Python应用Tesseract-OCR绑定,并进行图像上字符的识别。当前景文本与背景进行(非常)清晰的分割时,Tesseract-OCR将获得好的效果。原创 2021-08-21 14:58:39 · 1237 阅读 · 0 评论 -
Windows安装用于OCR的Tesseract及使用命令行参数进行OCR
这篇博客将介绍如何安装和使用光学字符识别(OCR Optical Character Recognition)的Tesseract库,并使用命令行对图像中的字符进行识别;**除非图像被清晰地分割,否则 Tesseract 会产生很差的结果。**在“嘈杂”输入图像的情况下,需要通过训练自定义机器学习模型来识别特定用例中的字符来获得更高的准确性。原创 2021-08-17 21:58:40 · 1135 阅读 · 0 评论 -
Python,OpenCV中的光学字符识别(OCR Optical Character Recognition)
这篇博客将介绍什么是光学字符识别OCR,介绍OCR发展的简短历史,发现真实的OCR应用程序,了解OCR与方向和脚本检测(OSD)之间的区别,OSD是许多最先进的OCR引擎中的常见组件。并了解图像预处理和后处理对于提高OCR结果的重要性。原创 2021-08-13 21:48:57 · 1946 阅读 · 0 评论