这是一种基于图像分割的文本检测方法,具体的结构是resnet50+fpn提取特征,设计的loss function检测不同尺寸的跟文本形状相同的anchor,最后通过pse算法也就是bfs算法把每个anchor连接起来,形成最后的文本框。
https://blog.csdn.net/ft_sunshine/article/details/90244514
https://zhaopeng0103.github.io/%E6%96%87%E6%9C%AC%E6%A3%80%E6%B5%8B/CVPR2019-%E6%97%B7%E8%A7%86%E7%A7%91%E6%8A%80%E6%8F%90%E5%87%BAPSENet%E6%96%87%E6%9C%AC%E6%A3%80%E6%B5%8B%E7%AE%97%E6%B3%95/