极简笔记 Unsupervised Discovery of Object Landmarks as Structural Representations

Unsupervised Discovery of Object Landmarks as Structural Representations

本文的核心是提出一种无监督的方法检测物体的关键点。这个具有语义性质的关键点不是人为定义的而是自动学得的。
这里写图片描述

文章主要思路是利用autoencoder模型,在中间部分添加各种loss约束引导检测的关键点heatmap的生成。主要架构见上图,encoder部分有俩不同的hourglass组成,上面一个得到K+1个channel的heatmap(K个关键点+背景),在此添加三个约束:
1. Concentration constraint,计算单个heatmap两个维度的方差,使它们尽量小,这样就可以尽量集中到一个点;
2. Separation constraint,使得每个channel得到的关键点尽量分开
3. Equivariance constraint,对输入图像做可控的扰动(放缩、旋转等变化),要求对应的关键点位置产生相应变化,即具有不变性。

因为是autoencoder模型,还需要做decoder计算与原图的重构误差。但是只有关键点的信息不足以重建图像,因此用了第二个encoder产生又一个feature map F F (通道数不是K+1)用于描述重构所需信息。然后每个关键点的heatmap作为attention map乘上 F 之后再做一个关键点相关的降维线性变换 Wk W k 得到关键点对应的特征描述 f

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值