PaddleOCR——the first week

2021SC@SDUSC

  1. 分组:

    ​ 组长:佟义哲 博客链接:https://blog.csdn.net/shy2218

    ​ 组员:

    ​ 郑茜 https://blog.csdn.net/pinkray_c?spm=1010.2135.3001.5343

    ​ 贾颖欣 https://blog.csdn.net/weixin_45873017

    ​ 耿杉杉 https://blog.csdn.net/scarlettwx

  2. 选题:PaddleOCR代码分析 网址https://gitee.com/paddlepaddle/PaddleOCR

  3. 分工:(每周更新)

    分为文字检测组和文字识别组:

    ​ 文字检测:佟义哲,耿杉杉(包含方向分类器)

    ​ 文字识别:贾颖欣,郑茜

    1. 第一周任务(10/01-10/08)
      1. 分析PaddleOCR的大体框架,并能用自己的语言描述。
      2. 分析PaddleOCR的包结构,明确接下来分析的重点和难点。
      3. 分析PaddleOCR论文,doc/PPOCR.pdf · PaddlePaddle/PaddleOCR - 码云 - 开源中国 (gitee.com),并根据论文内容积累分析前序知识,方便后续开展详细分析。

4.代码的下载和安装配置
  我从Gitee上下载了PaddleOCR-release-2.2,程序的运行是在PyCharm。
  对于中文OCR模型快速使用,我下载了官方提供的用于中英文超轻量OCR模型的检测和识别的inference模型,其中包括检测、分类和识别三部分。下载完毕后将这三部分所在的文件夹放到一个名为inference的文件夹之下,并新建inference_results文件夹作为识别后图片的存放文件夹。代码的tools文件夹之下的infer文件夹的predict_system.py中也要添加相应的代码来指引服务器找到模型。之后在PyCharm的terminal上输入命令行就可以使用中英超轻量OCR模型了。
  运行中出现的问题主要是因为官方给的命令行在电脑上不适用。官方命令为python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_ppocr_server_v2.0_det_infer/" --rec_model_dir="./inference/ch_ppocr_server_v2.0_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/" --use_angle_cls=True --use_space_char=True。实际使用中输入此命令行会出现地址不对的问题。我查阅了CSDN上的文章后发现,img_dir、det_model_dir等参数,在源码中已规定为字符串,所以再使用双引号(""),就导致路径不对,去掉双引号即可,而且python3要换成python。更改后为python tools/infer/predict_system.py --image_dir=./doc/imgs/test_train.jpg --det_model_dir=./inference/ch_ppocr_mobile_v1.1_det_infer/ --rec_model_dir=./inference/ch_ppocr_mobile_v1.1_rec_infer/ --cls_model_dir=./inference/ch_ppocr_mobile_v1.1_cls_infer/ --use_angle_cls=True --use_space_char=True --use_gpu=False
  如果要实现其他语言的文字提取只需更换相应的inference模型。
  具体的程序原理分析将在以后的时间进行。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值