本项目基于yolo3 与crnn 实现中文自然场景文字检测及识别
master分支将保留一周,后续app分支将替换为master
实现功能
文字方向检测 0、90、180、270度检测(支持dnn/tensorflow)
支持(darknet/opencv dnn /keras)文字检测,支持darknet/keras训练
不定长OCR训练(英文、中英文) crnn\dense ocr 识别及训练 ,新增pytorch转keras模型代码(tools/pytorch_to_keras.py)
支持darknet 转keras, keras转darknet, pytorch 转keras模型
新增对身份证/火车票结构化数据识别
新增语音模型修正OCR识别结果
新增CNN+ctc模型,支持DNN模块调用OCR,单行图像平均时间为0.02秒以下
优化CPU调用,识别速度与GPU接近(近期更新)
环境部署
GPU部署 参考:setup.md
CPU部署 参考:setup-cpu.md
下载编译darknet(如果直接运用opencv dnn或者keras yolo3 可忽略darknet的编译)
git clone https://github.com/pjreddie/darknet.git
mv darknet chineseocr/
##编译对GPU、cudnn的支持 修改 Makefile
#GPU=1
#CUDNN=1
#OPENCV=0
#OPENMP=0
make
修改 darknet/python/darknet.py line 48
root = '/r