PSENet源码阅读笔记

最新推荐文章于 2024-07-04 15:13:43 发布

ACM_Nestling

最新推荐文章于 2024-07-04 15:13:43 发布

阅读量3.5k

点赞数 2

分类专栏：深度学习

本文链接：https://blog.csdn.net/u010734277/article/details/90813756

版权

本文详细解读PSENet论文，重点介绍其使用FPN提取特征和C++实现的广度优先搜索算法在文字检测中的应用。在TensorFlow中复现模型，并探讨训练与预测过程，包括pybind11在Python调用C++代码的作用。

摘要由CSDN通过智能技术生成

论文在这里

这篇论文已经有很多人写过解析了，方法就大致说一说就好了。看这篇论文的时候学习了他们代码的实现，感觉学到了很多东西，就在这里讲一讲和代码实现有关的东西。

论文提要

我看的代码，原作者的博客讲了原理方面的内容。首先用FPN在图片中生成“推荐区域”，将“推荐区域”利用广度优先搜索进行合并，得到最后的结果。
论文中主要的东西是，使用FPN提取出图片中不同粗细的可能是文字的部分，然后使用广度优先搜索将FPN得到的几个部分给区分开。

代码实现

复现的论文神经网络部分使用的是tensorflow，广度优先搜索部分使用C++实现。
先从train.py开始看，103行定义了损失函数，在tower_loss函数中，构建了模型。模型的输出seg_maps是一个6通道的tensor，对应了论文中segmentation result。在train.py中没有引用到pse，pse在训练的过程中没有用到。
预测的过程在eval.py中。

# eval.py,第76行
def detect(seg_maps, timer, image_w, image_h, min_area_thresh=10, seg_map_thresh=0.9, ratio = 1)

最低0.47元/天解锁文章

ACM_Nestling

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
11
评论
PSENet源码阅读笔记

目录开篇论文提要代码实现新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入开篇论文在这里这篇论文已经有很多人...
复制链接

扫一扫

专栏目录