OCR本地化应用

OCR (Optical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

安装完成以后,基本上文件层次如下:

  • imgs 存放要是别的文件
  • tr 训练后的扩展文件库
  • tr_gpu gpu版本的库
  • 其它的一些文件

在这里插入图片描述
由于这个项目原生是没有接口调用功能,在此基础上加了采用flask写的接口

import flask, json
from flask import request
import tr
import sys, cv2, time, os
from PIL import Image, ImageDraw, ImageFont
import numpy as np
from io import BytesIO

server = flask.Flask(__name__)

@server.route('/getText', methods=['get', 'post'])
def getText():
    img_file = request.files['file']
    img_file.save("imgs/22.png")
    txt = tr.run("imgs/22.png")
    return json.dumps(txt, ensure_ascii=False)
if __name__ == '__main__':
    server.run(debug=True, port=8888, host='0.0.0.0')

代码跑起来的结果:
在这里插入图片描述
跑完了以后我们测试接口:
在这里插入图片描述
经过多此测试,本模型对比较工整的文本数据比较友好,是比率能达到99.99%,对于手写字体识别率方面还是有一点差。

总结了本开源项目的优点和缺点:
免费、易用、扩展性适中
手写识别差、cpu占用较高

另外一个大神提供了TrWebOcr支持web使用的ocr
在这里插入图片描述
用vue写的一个前端界面,用tornado写的web接口
在这里插入图片描述
对外接口

def make_app():
    from backend.webInterface import tr_run
    from backend.webInterface import tr_index

    return tornado.web.Application([
        (r"/api/tr-run/", tr_run.TrRun),
        (r"/", tr_index.Index),
        (r"/(.*)", StaticFileHandler,
         {"path": os.path.join(current_path, "dist/TrWebOcr_fontend"), "default_filename": "index.html"}),

    ], **settings)

主方法,入口

if __name__ == "__main__":
    define("port", default=8089, type=int, help='指定运行时端口号')
    define("open_gpu", default=0, type=int, help='是否开启gpu')

    tornado.options.parse_command_line()
    port = options.port
    open_gpu = options.open_gpu

    if open_gpu == 0:
        manage_running_platform.change_version('cpu')
    else:
        manage_running_platform.change_version('gpu')
    app = make_app()

    server = tornado.httpserver.HTTPServer(app)
    # server.listen(port)
    server.bind(port)
    server.start(1)
    print(f'Server is running: http://{host_ip()}:{port}')
    print(f'Now version is: {manage_running_platform.get_run_version()}')

    # tornado.ioloop.IOLoop.instance().start()
    tornado.ioloop.IOLoop.current().start()
  • tr开源项目地址: https://github.com/myhub/tr
  • TrWebOCR地址:https://github.com/alisen39/TrWebOCR/
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值