LSTM + CTC + Tensorflow示例
github地址:https://github.com/synckey/tensorflow_lstm_ctc_ocr
这是一个使用lstm和ctc来端到端识别图片中序列数字的demo。
例如:给出下面的图片,模型会得出结果 73791096754314441539
。
安装
pip install opencv-python
brew install cmake
brew tap homebrew/science
brew install opencv
sh ./prepare_train_data.sh
prepare_train_data.sh
脚本将下载SUN数据库并解压图片到bgs目录。然后你可以运行python gen.py
来生成测试和训练目录。
当训练数据和测试数据集准备好以后,您可以开始训练过程nohup python lstm_and_ctc_ocr_train.py
。
软件环境要求
- Python 2.7+
- Tensorflow 1.0+
- python_speech_features
- numpy
- SciPy
License
该项目依赖MIT条款获得许可。
获取更多详细信息,请参阅README。