DDDD-OCR增强版,就增加了一个功能:支持指定字符集。
你们是否在使用过程中遇到1识别成l,0识别成o的情况,但是实际上你所需要识别的文本中并不存在字符l和o,你需要识别的内容可能是纯数字的文本却经常识别成英文,如果遇到这种困扰,这一版增强中,便为你们解决了这个难点,
能够看到两个对比图,限定字符集之后,便只在这个字符集中选取最优结果了。
项目的源码基于 https://github.com/kerlomz/muggle-dl-deploy 项目,编译脚本使用test_compile.py 进行编译,模型来源于DDDD-OCR(https://github.com/sml2h3/ddddocr)提供的模型。部署采用的是FaskAPI+Gradio前端,部署之后可以用浏览器访问:http://127.0.0.1:19199/preview ,进行可视化测试,该部署服务还可以同时部署麻瓜系列框架的识别项目。
上述使用的测试代码
import base64
import grequests
import time
st = time.time()
with open(r"D:\Workplaces\Python\Framework\muggle-dl-deploy\projects\ddddocr\demo\image.png", "rb") as f:
b = f.read()
req_list = [grequests.post("http://127.0.0.1:19199/runtime/text/invoke", json={
"image": base64.b64encode(b).decode(),
"project_name": "ddddocr",
"extra": {"label_map": ["级", "速", "焕", "新"]}
}) for i in range(10)]
res_list = grequests.map(req_list)
for response in res_list:
if not response:
continue
print(response.text)
print(time.time() - st)
下载地址:
链接:https://pan.baidu.com/s/1Pr2s_2tIByDNM1uiiO-oSA?pwd=3a5b
提取码:3a5b
–来自百度网盘超级会员V5的分享