基于paddlepaddle的paddleocr库
- 2022/04/16更新:增加了正则表达式精确配对字符串
简单写了一款能够批量识别ocr图片并生成excel统计信息的小脚本
- 可以实现单张图片和批量图片的文字识别,帮助需要的人减轻人工审阅的压力
- 使用:
- 图片放入文件夹image中
- 执行脚本:具体可看main.py文件内容
python main.py --out_path path/to/your_path --data your_setting_data
- 查看out_path中文件
效果
识别性能:
- 30张/min
- 错误率1/30左右,根据图片的质量而定
源码地址:
https://github.com/nacayu/Shanghaijiankangyun_OCR_Automatic_Recognization
欢迎star!