CTPN论文阅读

CTPN论文阅读

CTPN,全称Connectionist Text Proposal Network。
是16年的一篇文本检测模型,作者是Zhi Tian等,发表于ECCV。(https://arxiv.org/abs/1609.03605)
同时也阅读了CrazySummerday实现pytorch版本的代码。(https://github.com/CrazySummerday/ctpn.pytorch)

这批论文实现的是一个文本检测模型。
经过对代码和论文的阅读(总觉得读代码比读论文容易。。),整理内容如下:

1,网络结构:
输入图像
–> 特征提取网络(VGG16去掉fc部分)
–> RPN(Region proposal network,3*3 Kernel的Conv层)
–> Bi-directional RNN(原论文用LSTM,CrazyS的代码用了GRN)。将前一结果featuer map,每一行(从左往右的点的特征向量)作为输入。
–> FC(对前一步骤的输出,经过全连层,输出预测内容。
预测内容包括了,每个特征点在原图对应区域里,十个anchor形状的:1,是否属于文本的得分。(分类问题)2,y轴上的位置修正,anchor的height的修正。(回归问题)

2,关于anchor。
熟悉rcnn之类的anchor based detection的可能不需要太多解释。
本文中的anchor统一宽度为16像素,(原因1,VGG16中的最后一个feature map对应原图中的大小1616。
原因2,本文的idea,用固定宽度的检测器,检测不同的高度的文本块。)
每个特征点对应了10个anchor,宽度统一为16,高度从11到283的10个不同的值,按照0.7的放大倍数产生。
比如如果输入图像经过VGG生成的feature map大小为10
10512,那么原图中共有1010*10个初始anchor。
初始anchor去掉越界的部分,剩下的和文字的groundtruth bounding box求交集,生产label和y差值和高度差值。作为训练时的y。

3,关于Loss。
分为两部分即classification和regression。

classification loss用于训练某个特征点的某个anchor的是否属于文本的得分。
文中用了softmax loss。

regression loss用于训练某个特征点的某个anchor的高度和y的偏移,论文中称为side refinement。
文中用了smooth L1 loss。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
CTPN (Connectionist Text Proposal Network) 是一种用于文本检测的方法,它可以在图像中定位和提取出文字区域。如果你想在MATLAB中实现CTPN,你可以参考以下步骤: 1. 首先,你需要准备一些训练数据和测试数据,包括图像和对应的文本标注。这些数据将用于训练和评估你的CTPN模型。 2. 然后,你需要下载并安装MATLAB深度学习工具箱,它提供了一系列用于构建和训练深度学习模型的函数和工具。 3. 接下来,你可以使用MATLAB中的深度学习工具箱来构建CTPN模型。你可以使用卷积神经网络 (CNN) 来提取图像特征,然后使用递归神经网络 (RNN) 来进行序列建模并生成文本框的坐标。 4. 在训练模型之前,你需要定义损失函数来衡量模型的性能,并选择适当的优化算法来调整模型的参数。你可以使用MATLAB中提供的函数来帮助你完成这些步骤。 5. 训练模型时,你可以使用训练数据来逐步调整模型的参数,使其逐渐收敛到最佳状态。你可以通过计算模型的损失函数来评估模型的性能,并根据需要对模型进行调整。 6. 在模型训练完成后,你可以使用测试数据来评估模型在新数据上的性能。你可以将图像输入到模型中,并使用模型生成的文本框坐标来定位和提取图像中的文字区域。 这只是一个大致的步骤指南,实际上在实现CTPN时可能会涉及到更多的细节和技巧。你可以参考相关的文献和代码库,例如 Github 上的一些开源实现,来获取更详细的指导和示例代码。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值