最近做文本识别需要用到CTPN,window下搭建环境花了不少功夫,做个笔记
项目GitHub地址
简介
CTPN在文本识别上表现优异,因为把RNN引入目标检测问题,加入了LSTM层,使其对连续文本的序列特征具有敏感性,增加了文本检测的精确度。
环境搭建
源码下载,python包环境就不多说,看requirements.txt就行
只提一下遇到的几个问题
1.import问题 报错No module named 'utils.rpn_msr'
在原项目utils文件下新建一个__init__.py文件,内容为空
2.bbox包编译问题,报错No module named nms
这个问题折腾了很久,作者给出的make.sh是在Linux下的编译方式,解决方法可以参考