DDDD-OCR二次开发【增强版】- 支持指定字符集

kerlomz

已于 2022-12-18 21:59:18 修改

阅读量1.9k

点赞数 1

分类专栏： OCR 验证码识别文章标签：深度学习 OCR 验证码识别

于 2022-12-18 21:18:49 首次发布

本文链接：https://blog.csdn.net/kerlomz/article/details/128366177

版权

验证码识别同时被 2 个专栏收录

21 篇文章 31 订阅

订阅专栏

OCR

11 篇文章 1 订阅

订阅专栏

DDDD-OCR增强版，就增加了一个功能：支持指定字符集。

你们是否在使用过程中遇到1识别成l，0识别成o的情况，但是实际上你所需要识别的文本中并不存在字符l和o，你需要识别的内容可能是纯数字的文本却经常识别成英文，如果遇到这种困扰，这一版增强中，便为你们解决了这个难点，

在这里插入图片描述

能够看到两个对比图，限定字符集之后，便只在这个字符集中选取最优结果了。

项目的源码基于 https://github.com/kerlomz/muggle-dl-deploy 项目，编译脚本使用test_compile.py 进行编译，模型来源于DDDD-OCR（https://github.com/sml2h3/ddddocr）提供的模型。部署采用的是FaskAPI+Gradio前端，部署之后可以用浏览器访问：http://127.0.0.1:19199/preview ，进行可视化测试，该部署服务还可以同时部署麻瓜系列框架的识别项目。

上述使用的测试代码

import base64
import grequests
import time

st = time.time()
with open(r"D:\Workplaces\Python\Framework\muggle-dl-deploy\projects\ddddocr\demo\image.png", "rb") as f:
    b = f.read()
req_list = [grequests.post("http://127.0.0.1:19199/runtime/text/invoke", json={
        "image": base64.b64encode(b).decode(),
        "project_name": "ddddocr",
        "extra": {"label_map": ["级", "速", "焕", "新"]}
    }) for i in range(10)]
res_list = grequests.map(req_list)
for response in res_list:
    if not response:
        continue
    print(response.text)
print(time.time() - st)