【一步一步的积累】Sketch Tokens

最新推荐文章于 2020-05-17 17:08:47 发布

十年的小白

最新推荐文章于 2020-05-17 17:08:47 发布

阅读量3k

点赞数 1

分类专栏：基础学习文章标签：图像处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/seavan811/article/details/46598281

版权

基础学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

(CVPR,2013) Sketch Tokens: A Learned Mid-level Representation for Contour and Object Detection

这篇文章有两个有意思的思想：

1）划分轮廓时，通常每一个像素点进行的是二分类，是轮廓或者不是轮廓，该文将问题转换为多类分类，一定程度上降低了分类器的难度。

2）将人工标注的轮廓信息作为多类分类的类标。但是轮廓有很多种，本文将所有的轮廓转换为有限的类标，是另一个有意思的地方。

该文的思路是：首先将人工标定好的binary图像，按照一个35*35的区域提取patch，每个区域中心需要正好在轮廓上，如此，我们可以得到很多的patch，也即是很多的轮廓形状。那么如何将它们分为有限的分类呢？如何分是合理呢？文章用到了k=150的Kmeans算法，那么要用Kmeans，就要有一个距离度量，文章使用的是Daisy特征。

那么有了合适的类标，即是sketch token，一个样本是一张RGB图像上的一个patch，然后对应的Binary轮廓图像上的patch对应的sketch token。那么接下来怎么训练呢？文中是对RGB图像提取两组feature：

1）features directly indexing into the channels：彩色通道，梯度大小，梯度方向等

2）self-similarity features：

接下来文章用随机森林进行分类，分类的目标是各sketch token的possibility。这样对图像每一个像素进行分类获得各token的possibility以及non-contour的possibility，然后用non-maximal suppression来找到最大响应的contour。

BTW：其实个人觉得，可以直接用图像patch来作为feature，然后CNN来训练网络。

十年的小白

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。