废话不多说,直接开干!
最近私活,遇到图像处理!
需要的材料
下载Tesseract-OC
下载简体字识别包
在系统变量中新建一个配置信息,命名为:TESSDATA_PREFIX,变量值为安装路径D:\Tesseract-OCR\tessdata
path路径D:\Tesseract-OCR
需要安装库
pip install pytesseract
特别注意tesseract与pillow版本要一致
安装tesseract,pip install pytesseract
安装pillow, pip install Pillow
直接上代码
# -*- coding: UTF-8 -*-
import pytesseract
from PIL import Image
def douyin():
image = Image.open("202106060946243820.jpg")
text = pytesseract.image_to_string(image,lang='chi_sim') #使用简体中文解析图片
with open('douyin.txt','w') as file:
print(text)
file.write(str(text))
if __name__ == '__main__':
douyin()
效果图