论文:FOTS: Fast Oriented Text Spotting with a Unified Network
论文翻译详解:https://zhuanlan.zhihu.com/p/195248125
code: https://github.com/jiangxiluning/FOTS.PyTorch
一. 版本依赖:
- python = 3.6.13
- pytorch = 0.4.0(1.0.0)
- gcc = 7.3.0
二. 配置过程:
- 创建虚拟conda环境python=3.6
- git clone 代码库
- conda 安装pytorch=0.4.0
- 编译build.sh文件
- 编译成功后卸载pytorch=0.4.0安装pytorch=1.0.0
- 执行训练代码:python train.py -c config
三. 其他注意事项
- 下载对应数据集并解压,修改config.json内容
- 编译build.sh文件必须要低版本的torch,高版本会出现各种编译问题;
- 编译过程种出现找不到cuda.h文件可在build.py种修改如下
- 编译成功后需要卸载低版本torch,安装torch=1.0.0,这是因为训练代码种调用了CTCLoss的API,该API只有torch>=1.0.0才有。
- 安装torch==1.0.0后执行训练代码,由于作者没有提供与训练模型所以需要自己下载,执行过程中缺少对应包时下载安装。
- urllib.error.URLError: <urlopen error 错误时在train.py中添加代码,该错误是SSL证书验证错误
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
- 默认config.json中的cuda是false,可改为true
- 训练一段epoch后rec loss出现nan,具体的修复可参考这个https://github.com/Holmeyoung/crnn-pytorch,pytorch=1.1.0版本亲测也可