本文基于tensorflow、keras/pytorch实现对自然场景的文字检测及端到端的OCR中文文字识别
Special Notes
原项目里会遗漏各种模型数据,可以在这个百度云盘里找到:Chinese_ocr-ctpn+crnn 。
可以使用 demo.py 跑起来整个流程(需要改下里面的 data_dir 路径)。
模型 VGGnet_fast_rcnn_iter_50000.ckpt 对应的模型文件应该放在 ctpn/ctpn_checkpoints 目录下面。
模型文件 modelAngle.h5 应该放在 angle 目录下面。
============
参考github仓库
实现功能
文字方向检测 0、90、180、270度检测
文字检测 后期将切换到keras版本文本检测 实现keras端到端的文本检测及识别
不定长OCR识别
环境部署
Bash
##GPU环境
sh setup.sh
##CPU环境
sh setup-cpu.sh
##CPU python3环境
sh setup-python3.sh
使用环境:python3.6+tensorflow1.7+cpu/gpu
模型训练
一共分为3个网络
1. 文本方向检测网络-Classify(vgg16)
2. 文本区域检测网络-CTPN(CNN+RNN)
3. EndToEnd文本识别网络-CRNN(CNN+GRU/LSTM+CTC)
文字方向检测-vgg分类
基于