文本检测算法一:CTPN
CTPN源码解析1-数据预处理split_label.py
CTPN源码解析2-代码整体结构和框架
CTPN源码解析3.1-model()函数解析
CTPN源码解析3.2-loss()函数解析
CTPN源码解析4-损失函数
CTPN源码解析5-文本线构造算法构造文本行
CTPN训练自己的数据集
由于解析的这个CTPN代码是被banjin-xjy和eragonruan大神重新封装过的,所以代码整体结构非常的清晰,简洁!不像上次解析FasterRCNN的代码那样跳来跳去,没跳几步脑子就被跳乱了[捂脸],向大神致敬!PS:里面肯定会有理解和注释错误的,欢迎批评指正!
解析源码地址:https://github.com/eragonruan/text-detection-ctpn
知乎:从代码实现的角度理解CTPN:https://zhuanlan.zhihu.com/p/49588885
知乎:理解文本检测网络CTPN:https://zhuanlan.zhihu.com/p/77883736
知乎:场景文字检测—CTPN原理与实现:https://zhuanlan.zhihu.com/p/34757009
整体流程图如下:
关键部分主要包括model()函数和loss()函数,下面会对model()函数和loss()函数分别解析。
model()函数处理流程
loss()函数处理流程
其中anchor_target_layer()流程如下:
文本线构造法
下面根据model()函数和loss()函数分别解析代码。