hourglass论文_深度学习领域,你心目中 idea 最惊艳的论文是哪篇?

提问者本人,发这篇回答是因为没想到第四天就被‘极市平台’公众号抄了。被朋友告知提问被‘转载’

事情不是多大个事,但我就是想喷它。我自己想的问题,自己写的描述,它直接拿来用了。

改问题我邀请了朋友来答,以及在不能一键邀请时一个个点了将近700个不认识的人,我并不觉得没有任何贡献的时候直接转载是个好习惯。

回答问题的答主们,也会写个谢邀呢。

总之,我最烦这种公众号抄袭。

另外,顺便详细介绍一下我提问中提到的AE论文,我的本意是哪篇论文的‘insight’最惊艳,它可能不需要很高的工程难度,AE就是这样一篇论文。

AE (Associative Embedding) 用于自底向上的多人姿态估计和语义分割,作者Alejandro Newell 同时也是Hourglass 的作者,可以说是天才人物频出佳作了。

自底向上的多人姿态估计要解决两个问题:预测关键点的位置

预测关键点属于哪个人

在AE之前,最出名的工作是OpenPose, 可以简述为,它让网络对每个像素输出一个offset,根据它我们计算某个关键点应该连向哪里,比如手腕A连接哪个手肘是正确的,也就是比较著名的PAFmap。后续工作比如PersonLab, 也都是在offset上变着花样。

那么AE的核心观点是:不需要规定某个关节点需要输出一个固定的值,来决定它属于某个人,只需规定属于不同人的关节点,输出的值有差异即可。只需关注属于不同人的关节点输出的值不同即可

总结来说对于损失函数:属于同一个人的关节点,输出的值应该相同 -> 损失函数为:当前值 - 该人的平均值。

属于不同人的关节点,输出应该不同 -> 损失函数为:(当前值 - 其他人的平均值)取负指数函数来改变单调性。

当时读完这篇paper,我个人觉得,自底向上的方法在关键点分类这一块基本上是结束了,这种数据驱动的分类方式几乎达到了理论最优。后来我不做pose 相关的研究时也关注了higher-HRNet等工作,确实最新的SOTA都采用了AE这种关键点分类方式。

感谢大家听我分享,也希望自己也有一天能做出有insight的工作~。https://arxiv.org/abs/1611.05424​arxiv.org

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值