import tesserocr
from PIL import Image
import numpy as np
if __name__ == '__main__':
# step1 实例化一个图片对象 返回值是一个标签
image = Image.open('./picture1.png')
print(image)
# step2 把图片对象转换为八位数的灰度图像 返回值是一个标签
image = image.convert('L')
print(image)
# step3 把图片用他的数组形式表示
image_array = np.array(image)
# step4 提供数组形式把图片转化为黑白图
# 处理数组(灰度大于五十的像素点转化为255白色,其余转为黑色)
threshold = 50
image_array = np.where(image_array > threshold, 255, 0)
# step5 把新的图片数组转化为图片
new_image = image_array.astype('uint8')
image = Image.fromarray(new_image)
# step6 提取图片中的文本信息并打印
print(image_array)
print(tesserocr.image_to_text(image))
# 显示图片
image.show()
# 保存图片
image.save('./picture2.png')
运行结果: