【一步一步的积累】Sketch Tokens

(CVPR,2013) Sketch Tokens: A Learned Mid-level Representation for Contour and Object Detection

这篇文章有两个有意思的思想:

1)划分轮廓时,通常每一个像素点进行的是二分类,是轮廓或者不是轮廓,该文将问题转换为多类分类,一定程度上降低了分类器的难度。

2)将人工标注的轮廓信息作为多类分类的类标。但是轮廓有很多种,本文将所有的轮廓转换为有限的类标,是另一个有意思的地方。

该文的思路是:首先将人工标定好的binary图像,按照一个35*35的区域提取patch,每个区域中心需要正好在轮廓上,如此,我们可以得到很多的patch,也即是很多的轮廓形状。那么如何将它们分为有限的分类呢?如何分是合理呢?文章用到了k=150的Kmeans算法,那么要用Kmeans,就要有一个距离度量,文章使用的是Daisy特征。

那么有了合适的类标,即是sketch token,一个样本是一张RGB图像上的一个patch,然后对应的Binary轮廓图像上的patch对应的sketch token。那么接下来怎么训练呢?文中是对RGB图像提取两组feature:

1)features directly indexing into the channels:彩色通道,梯度大小,梯度方向等

2)self-similarity features:

接下来文章用随机森林进行分类,分类的目标是各sketch token的possibility。这样对图像每一个像素进行分类获得各token的possibility以及non-contour的possibility,然后用non-maximal suppression来找到最大响应的contour。


BTW:其实个人觉得,可以直接用图像patch来作为feature,然后CNN来训练网络。
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值