前言
在做OCR文字识别的时候,或多或少会接触一些验证码图片,这里收集了一些验证码图片,可以对验证码进行识别,可以识别4到6位,纯数字型、数字+字母型和纯字母型的一些验证码,准确率还是相当高,需要的可以下载使用。
准备工作
1、Python环境,在Python官网下载安装
2、项目代码,下载地址在文章最后
代码量非常的少,可根据实际情况,通过fastapi、flask等web框架部署到服务器上。
开始
以上准备工作完成后,就可以开始使用
1、下载依赖包
pip install pyaml
pip install torch
pip install opencv-python
2、编写预测代码,cpu中运行
这里传入的图片,可以是图片路径,也可以是通过cv2将图片转成mat后再传入。
import os
import sys
from core.model import OCRRecognition
if __name__ == '__main__':
ocr = OCRRecognition("./core/model/pytorch_model.pt",
"./core/model/vocab.txt",
device="cpu"
)
result = ocr("images/001.png")
print(result)
3、gpu中运行
默认使用cpu运行,如果需要在gpu中运行,首先要配置GPU环境,可通过这篇文章进行配置【Ubuntu系统配置深度学习环境之nvidia显卡驱动和cuda安装】。
安装完成后,初始化方法改成:
ocr = OCRRecognition("./core/model/pytorch_model.pt",
"./core/model/vocab.txt",
device="gpu"
)
4、运行结果展示
输入图片:
实际运行效果还不错。
完毕!!!
模型及代码下载:基于Pytorch的验证码识别模型应用资源