最近在学习如何将验证码中的汉字识别出来,然后自己开发一个ocr识别接口,所以下面把我的学习过程记录下来。
第一步:下载安装相关的框架和工具
1.pip install paddlepaddle==2.1.0 --default-time=1000
2.pip install “paddlerocr>=2.0.1” --default-time=1000
3.pip install layoutparser --default-time=1000
第二步:测试安装,我们可以导入一个图片检查一下
4.paddleocr --image_dir D:\liousa\1.jpg --use_angle_cls true --use_gpu false
这个就是我的测试图片啦:
测试的结果还是可以的,基本上文字都识别出来啦
以下是运行结果:
[2024/07/02 09:58:21] ppocr INFO: **********D:\liousa\1.jpg**********
[2024/07/02 09:58:23] ppocr DEBUG: dt_boxes num : 11, elapsed : 1.0538437366485596
[2024/07/02 09:58:24] ppocr DEBUG: cls num : 11, elapsed : 0.2448897361755371
[2024/07/02 09:58:26] ppocr DEBUG: rec_res num : 11, elapsed : 2.586439609527588
[2024/07/02 09:58:26] ppocr INFO: [[[35.0, 19.0], [421.0, 19.0], [421.0, 83.0], [35.0, 83.0]], ('上午10:3700', 0.8963978290557861)]
[2024/07/02 09:58:26] ppocr INFO: [[[810.0, 15.0], [963.0, 22.0], [961.0, 81.0], [807.0, 74.0]], ('196 k%s', 0.8010726571083069)]
[2024/07/02 09:58:26] ppocr INFO: [[[1075.0, 29.0], [1312.0, 29.0], [1312.0, 75.0], [1075.0, 75.0]], ('3G·····', 0.7517674565315247)]
[2024/07/02 09:58:26] ppocr INFO: [[[1392.0, 21.0], [1517.0, 21.0], [1517.0, 83.0], [1392.0, 83.0]], ('75', 0.9995169639587402)]
[2024/07/02 09:58:26] ppocr INFO: [[[577.0, 149.0], [966.0, 155.0], [964.0, 240.0], [576.0, 234.0]], ('facebook', 0.9966444969177246)]
[2024/07/02 09:58:26] ppocr INFO: [[[96.0, 379.0], [459.0, 379.0], [459.0, 435.0], [96.0, 435.0]], ('请完成安全验证', 0.9991410970687866)]
[2024/07/02 09:58:26] ppocr INFO: [[[123.0, 551.0], [1030.0, 526.0], [1037.0, 771.0], [130.0, 797.0]], ('Se3Py93', 0.5270927548408508)]
[2024/07/02 09:58:26] ppocr INFO: [[[91.0, 813.0], [251.0, 813.0], [251.0, 872.0], [91.0, 872.0]], ('换一个', 0.99896639585495)]
[2024/07/02 09:58:26] ppocr INFO: [[[707.0, 1115.0], [829.0, 1115.0], [829.0, 1184.0], [707.0, 1184.0]], ('继续', 0.9972751140594482)]
[2024/07/02 09:58:26] ppocr INFO: [[[560.0, 1275.0], [975.0, 1269.0], [976.0, 1325.0], [561.0, 1331.0]], ('不是其巍?请 登录', 0.9955735206604004)]
接下来我们来开发自己的ocr识别接口吧!!!