- 随机获取了知网登录界面的三个图片验证码,测试 tesserocr 识别验证码的准确度
- 编写代码,先测试pic1
import tesserocr # 导入tesserocr模块
from PIL import Image # 导入图像处理模块
img = Image.open('pic1.png')
code_result = tesserocr.image_to_text(img)
print('识别结果:', code_result)
- pic1识别结果:PEHK.
- 由于验证码图片中带有很多干扰线条,导致识别结果不准确(后面多一个点).
- 接下来,进行图片灰度测试看看能不能解决问题
import tesserocr # 导入tesserocr模块
from PIL import Image # 导入图像处理模块
img = Image.open('pic1.png')
lim = img.convert('L') # 图片灰度化
img.show()