Pytesseract图片识别结果箭头符号去除

在使用pytesseract进行OCR识别时,遇到识别结果包含多余的向上箭头符号和换行。通过调用.strip()方法移除了这些不必要的字符。问题出现在0.3.5和0.3.6版本,解决方案是利用代码处理识别后的字符串。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在使用pytesseract模块的image_to_string()功能时,识别出的结果总是带有这个向上的箭头 在这里插入图片描述
和很多的换行符,在0.3.5/0.3.6版本均有多余箭头问题.

只要使用.strip()移除字符串头尾指定的字符(默认为空格或换行符)或字符序列代码如下:

import os
import sys
import pytesseract
from PIL import Image

def ocrx(image_name,lang_name):
    # open image
    image = Image.open(image_name)
    code = pytesseract.image_to_string(image, lang=lang_name)#选择语言库
    code = code.strip()
    #print(code)
    return code

Result = ocrx("G0.jpg",'eng')
print(Result)

待识别的图片G0.jpg
G0.jpg

执行结果如下:
执行结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值