python打错了字母怎么办_为什么python tesseract给了错误的字母框？

luminousLCH

于 2021-02-10 13:13:54 发布

阅读量179

点赞数

文章标签： python打错了字母怎么办

本文链接：https://blog.csdn.net/weixin_33513218/article/details/113982016

版权

我使用的是python tesseract包装器(tesserocr)，而不是tesseract v4。我在一个简单的“HELLO WORLD”黑白图像上运行一些示例代码，但是虽然字母被正确识别，但是我得到了错误的边界框，看到原始图像覆盖了结果

下面是基于this SO post的代码。你知道如何得到正确的bboxes吗？谢谢您！在import cv2

import json

from PIL import Image

from tesserocr import PyTessBaseAPI, RIL

img = cv2.imread('helloworld.jpg')

gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

pillowImg = Image.fromarray(gray_img)

with PyTessBaseAPI() as api:

api.SetImage(pillowImg)

api.Recognize()

ri = api.GetIterator()

level = RIL.SYMBOL

for r in tesserocr.iterate_level(ri, level):

bbox = r.BoundingBoxInternal(level)

symbol = r.GetUTF8Text(level)

conf = r.Confidence(level)

print(json.dumps([symbol, conf, bbox]))

输出如下：

^{pr2}$

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

luminousLCH

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

ocr.rar_OCR python_OCR识别_Python Tesseract_ocr python_python

07-15

OCR（Optical Character Recognition，光学字符识别）技术是将图像中的文字转换为机器可读文本的一种方法。在Python中，Tesseract是一个强大的OCR引擎，由Google维护，它提供了丰富的功能来识别各种字体和语言的文本...

python识别数字字母验证码_win10安装tesserocr配置 Python使用tesserocr识别字母数字验证码...

weixin_39991222的博客

12-03

105

链接：https://pan.baidu.com/s/1l2yiba7ZTPUTf41ZnJ4PYw提取码：t3bqwin10安装tesserocr首先需要下载tesseract，它为tesserocr提供底层支持。具体下载官方路径：https://github.com/UB-Mannheim/tesseract/wiki，选择对应的系统版本，可以选择一个相对不带dev的稳定版本下载，如：tess...

参与评论您还未登录，请先登录后发表或查看评论

python api调用tesseract_tesseract-ocr API的一个Python封装

weixin_31934101的博客

01-14

460

tesserocrA simple, Pillow-friendly, wrapper around the tesseract-ocr API for Optical Character Recognition (OCR). tesserocr integrates directly with Tesseract's C++ API using Cython which allows for...

python运行错误总结（按字母序）

miahhrgbfcyur的博客

08-12

273

1. expected an indented block：缩进错误

python检测边界_使用python-tesseract获取已识别单词的边界框

weixin_39897449的博客

12-04

220

I am using python-tesseract to extract words from an image. This is a python wrapper for tesseract which is an OCR code.I am using the following code for getting the words:import tesseractapi = tesser...

编写Tesseract的Python扩展

weixin_30505043的博客

07-18

101

Tesseract是一个开源的OCR（光学字符识别）引擎，用于识别并输出图片中的文字。虽然和商业软件比起来识别精度不算很高，但是如果你要寻找免费开源的OCR引擎，可能Tesseract就是唯一的选择了。Tesseract用起来还算是比较方便。它提供了一个简单的命令行工具，没有很多选项，输入图片输出就是文字。因为是开源的，你也可以直接编译使用它基于C++的库。最近一段时间我对Python产生了很...

Python3.6使用tesseract-ocr的正确方法

09-20

本文主要介绍了如何在Python3.6环境下正确安装和使用tesseract-ocr进行光学字符识别（OCR）。首先，文章对tesseract-ocr项目进行了简要的介绍，它是由HP实验室研发的开源OCR引擎，后来由Google接手并改进。tesseract...

python_ocr_total_tesseract_pytesser

10-23

Python OCR（光学字符识别）是将图像中的文本转换为机器编码文本的技术，这对于处理扫描文档、图片中的文字或从各种非标准来源提取信息至关重要。在本主题中，我们将重点讨论两个关键工具：Tesseract和Pytesser。 ...

Python文字识别之tesseract-ocr安装包和中文语言包chi_sim.traineddata下载

06-19

本资源提供Python文字识别之tesseract-ocr安装包和中文语言包chi_sim.traineddata免费下载。 tesseract-ocr：tesseract-ocr-w64-setup-v5.1.0.20220510.exe；中文语言包：chi_sim.traineddata

ocr_python.tar.gz_OCR_ocr python_ocr_python_python_python ocr

09-20

`pytesseract`是Tesseract的一个简单接口，它提供了将图像转换为文本的函数。安装`pytesseract`库通常通过以下命令完成： ``` pip install pytesseract ``` 需要注意的是，`pytesseract`依赖于Tesseract OCR引擎的...

Python 报错解决方法

u011378313的博客

01-16

2557

1、在学习爬虫时，将代码复制上去试着运行，结果就报出一下错误： SyntaxError: Non-ASCII character '\xe5' 百度了一下，在这里记录一下解决方法：出现这个错误的原因是python默认的编码是ASCII码，而文件中出现中文，需要在文件开头输入：# -*- coding:UTF-8 -*-，再运行发现问题已经解决。 2、python注释方法（pycharm）

Python - 错误和异常

qq_33801641的博客

03-25

217

语法错误错误一般就是指语法错误，也是解析错误；通常在IDE已经会提醒有语法错误了 while True print("test") 执行结果 File "C:/异常.py", line 11 while True ^ SyntaxError: invalid syntax 解析器会报错，直接指向语法有错的地方重点！异常描述：...

python字符编码错误的解决方案

酒醉东坡的专栏

11-02

1916

第一条：SyntaxError: Non-ASCII character '\xc4' in file E:\***.py on line 3, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details。 [解决方案] 在文件头上添加一行 #coding:utf-8

自然语言处理-错字识别（基于Python）kenlm、pycorrector

IT届的小学生

11-15

1万+

中文文本纠错划分中文文本纠错任务，常见错误类型包括：谐音字词，如配副眼睛-配副眼镜混淆音字词，如流浪织女-牛郎织女字词顺序颠倒，如伍迪艾伦-艾伦伍迪字词补全，如爱有天意-假如爱有天意形似字错误，如高梁-高粱中文拼音全拼，如 xingfu-幸福中文拼音缩写，如 sz-深圳语法错误，如想象难以-难以想象当然，针对不同业务场景，这些问题并不一定全部存在，比如输入法中需要处...

关于python:AttributeError: module 'xxx' has no attribute 'xxx'的错误解决

热门推荐

AzureL

05-05

15万+

运行python程序时，也许会出现这样的错误：AttributeError: module ‘xxx’ has no attribute ‘xxx’，如：在我的学习中，解决该错误有两种方法手动安装该模块检查文件名这个方式看起来很傻，但是却是新手经常会犯的错，原因是因为自己的文件名称和要使用的模块重名了：只需要更改文件名即可 ...

python输入字母错误怎样修改_Python添加异常(已编辑)

weixin_39999532的博客

12-03

725

这是一个简单的程序，我正在学习python，因为我是初学者。如果用户输入其他的y，y，n，N，我将如何添加异常。我到处搜索，但似乎无法找到什么例外使用？感谢大家的帮助。编辑：我调整了我的代码。唯一不起作用的是if(welcomeString.strip()。lower()！='n'或'y')：welcomeString = input('不是一个有效的选择\ n您是否想要反转一个字符串？(y / ...

Python脚本报错AttributeError: ‘module’ object has no attribute’xxx’解决方法

八月的专栏

01-14

4万+

Python脚本报错AttributeError: ‘module’ object has no attribute’xxx’解决方法 2014年04月30日 ⁄ 测试工具, 软件测试 ⁄ 共 678字 ⁄ 字号小中大 ⁄ 暂无评论 ⁄ 阅读 12,782 次最近在编写Python脚本过程中遇到一个问题比较奇怪：Python脚本正常的，但执行报错"A

python打错了字母怎么办_在Python中解决中英文混杂出错的问题

weixin_39612110的博客

12-10

448

前两天用Python写了个小脚本，其中有个需求是从一个文本文件A中读取数据，然后处理一下写进一个新的文本文件B中。不过A文件中既有英文也有中文。写出处理这个需求的代码并不复杂，随手就能写下类似的代码：1def write_a_line(line, fp):2 fp.write(line)不过这段程序一旦碰到有汉字的字符串时，可能就会遇到下面的问题：Traceback (most recent...

LeetCode 438. Find All Anagrams in a String

Infi_zc

02-25

211

题目给定一个字符串 s 和一个非空字符串 p，找到 s 中所有是 p 的字母异位词的子串，返回这些子串的起始索引。字符串只包含小写英文字母，并且字符串 s 和 p 的长度都不超过 20100。说明：字母异位词指字母相同，但排列不同的字符串。不考虑答案输出的顺序。示例1：输入: s: "cbaebabacd" p: "abc" 输出: [0, 6] 解释: 起始索引等于 0 的...

Python3.5 SVM字母验证码识别教程

"本文介绍了如何使用Python3.5和scikit-learn（sklearn）库实现一个基于SVM（Support Vector Machine，支持向量机）的字母验证码识别系统。作者在研究人工智能时，选择创建一个能自动识别字母验证码的程序，以加深对...