菜鸟用Python 识别批量图片,再读取文字(用百度文字识别)

本文介绍了菜鸟使用Python结合百度文字识别API进行批量图片中文字的读取操作,分享了相关代码实现,初学者可参考。
摘要由CSDN通过智能技术生成

直接上代码吧,本人菜鸟刚学的,有问题指教


MyPath = "G:\\python\\xxxxx\\"#这是读取的图片存放的文件夹的路径,可以改为要读取的文件夹
filesoure = MyPath
def baiduduqu(filesoure,filename):
	from aip import AipOcr
	import re
	import os
	APP_ID = 'xxxx'
	API_KEY = 'xxxxx'
	SECRET_KEY = 'xxxx'
	client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
	dakai = open(filename,'rb')
	duqu = dakai.read()
	message = client.basicGeneral(duqu)
	for duqu in message.get('words_result'):
		print(duqu.get('words'))

def filename (fielsoure,filetype):
	import os
	pathDir = os.listdir(filesoure)
	for allDir in pathDir:
		child = os.path.join('%s%s' % (filesoure,allDir))
		print(child)
		baiduduqu(filesoure,child)
def run():
	import os
	os.chdir(filesoure)
	for i in os.listdir(os.getcwd()):
		postfix = os.path.splitext(i)[1]
		if postfix == '.jpeg' or postfix =
Python图片文字识别库有多种选择,常用的包括Pytesseract和PaddleOCR。 Pytesseract是一个基于Tesseract OCR引擎的Python库,可以用于识别图片中的文字。使用Pytesseract可以很方便地将图片转换为文本,只需要导入相应的库并调用相应的函数即可。例如,你可以使用以下代码来实现图片文字识别: 引用: ```python import pytesseract from PIL import Image text = pytesseract.image_to_string(Image.open(r"d:\Desktop\39DEE621-40EA-4ad1-90CC-79EB51D39347.png")) print(text) ``` PaddleOCR是一个基于PaddlePaddle深度学习框架的开源OCR工具库。它具有更高的识别准确率和更广泛的应用场景。PaddleOCR支持多种语言的文字识别,并提供了一键安装和使用的便捷性。你可以通过以下代码批量识别图片中的文字: 引用: ```python import os import pytesseract path = 'text_img/' imgs = [os.path.join(path, i) for i in os.listdir(path)] f = open('text.txt', 'w', encoding='utf-8') for img in imgs: f.write(img + '\n') f.close() string = pytesseract.image_to_string('text.txt', lang='chi_sim') print(string) ``` 除了Pytesseract和PaddleOCR,还有其他OCR库也可以用于图片文字识别,具体选择可以根据你的需求和实际情况来决定。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [适合小白的几个入门级Python ocr识别库](https://blog.csdn.net/qq_38017966/article/details/118724459)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [图片文字识别python](https://blog.csdn.net/m0_54240221/article/details/124699773)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值