【论文速读】Dan_Deng_AAAI2018_PixelLink_Detecting_Scene_Text_via_Instance_Segmentation

最新推荐文章于 2024-08-26 18:56:03 发布

weixin_30547797

最新推荐文章于 2024-08-26 18:56:03 发布

阅读量136

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/lillylin/p/9955024.html

版权

Dan Deng——【AAAI2018】PixelLink_Detecting Scene Text via Instance Segmentation

作者和代码

tensorflow代码

关键词

文字检测、多方向、直接回归、$$xywh\theta$$、one-stage、开源

方法亮点

使用instance segmentation的思路做（利用了二类分类+每个像素点与周围8个顶点的link分类）
利用图像处理方法进行后处理，不需要用NMS

方法概述

本文方法采用instance segmentation思路，预测text/non-text和pixel-link关系，再使用简单的图像处理的方式进行后处理来去除噪声。

方法细节

方法流程图

网络结构

Link定义

两个像素的都是positive（text）-> link是positive
一个是text，一个是non-text -> link是positive
两个都是non-text -> link是negative

损失函数

总损失

pixel 损失（Instance-Balanced Cross-Entropy Loss）

利用每个instance的面积来对其loss进行加权，目的是为了提高小目标对loss的贡献。

link损失

link_CE是Cross-Entropy loss。

后处理

通过pixel信息来链接Text/non-text prediction的score map里的像素，得到instance segmentation map
利用OpenCV的minAreaRect来提取oriented rectangle
使用后处理过滤噪声
- 去掉短边小于10个像素的box
- 去掉面积小于300的box
- 其他利用长宽比等（参数设置为在训练集上做统计，利用百分比对应的值作为参数，例如99%以上的文字短边都大于10,）

实验结果

ICDAR2015

MSRA-TD500

ICDAR2013

模型分析对比实验

总结与收获

这篇方法采用纯分割的思路，完全没有利用目标检测的方法，连后处理都没用nms，方法还是比较特别的。

转载于:https://www.cnblogs.com/lillylin/p/9955024.html

weixin_30547797

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【论文速读】Dan_Deng_AAAI2018_PixelLink_Detecting_Scene_Text_via_Instance_Segmentation

Dan Deng——【AAAI2018】PixelLink_Detecting Scene Text via Instance Segmentation作者和代码tensorflow代码关键词文字检测、多方向、直接回归、$$xywh\theta$$、one-stage、开源方法亮点使用instance segmentation的思路做（利用了二类分类+每个像素点与周围8个顶点的li...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。