本项目基于yolo3 与crnn 实现中文自然场景文字检测及识别
由于本项目融合多个框架,维护较困难,为了更好的部署应用,后续将只围绕darknet框架进行开发,不在支持keras、tensorflow、pytorch。
实现功能
文字方向检测 0、90、180、270度检测(支持dnn/tensorflow)
支持(darknet/opencv dnn /keras)文字检测,支持darknet/keras训练
不定长OCR训练(英文、中英文) crnn\dense ocr 识别及训练 ,新增pytorch转keras模型代码(tools/pytorch_to_keras.py)
支持darknet 转keras, keras转darknet, pytorch 转keras模型
身份证/火车票结构化数据识别
新增CNN+ctc模型,支持DNN模块调用OCR,单行图像平均时间为0.02秒以下
CPU版本加速
支持基于用户字典OCR识别
新增语言模型修正OCR识别结果
支持树莓派实时识别方案
环境部署
GPU部署 参考:setup.md
CPU部署 参考:setup-cpu.md
下载编译darknet(如果直接运用opencv dnn或者keras yolo3 可忽略darknet的编译)
git clone https://github.com/pjreddie/darknet.git
mv darknet chineseocr/
##编译对GPU、cudnn的支持 修改 Makefile
#GPU=1
#CUDNN=1
#OPENCV=0
#OPENMP=0