姿态估计-UDP论文解读

‘Atlas’

已于 2022-05-17 11:46:58 修改

阅读量1k

点赞数 2

分类专栏：论文详解姿态估计文章标签：计算机视觉姿态估计 udp

于 2021-08-08 00:20:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41994006/article/details/119494582

版权

论文详解同时被 2 个专栏收录

72 篇文章 15 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

文章目录

解决问题
创新点
算法原理
- 坐标转换
- 无偏关键点格式转换
实验结果
总结

论文：《The devil is in the details: Delving into unbiased data processing for human pose estimation》
GitHub地址： https://github.com/HuangJunJie2017/UDP-Pose

解决问题

1、标准的数据处理主要包括坐标系统转换以及关键点格式转换，作者发现常规翻转后结果与原始推理结果不一致；
2、并且在关键点格式转换中存在统计误差。

创新点

为了从源头上解决这两个问题，作者提出无偏数据处理（UDP），包括无偏坐标系变换和无偏关键点格式变换。

算法原理

坐标转换

当发生反转增强时，会出现坐标误差。比如：
图片尺寸： $W * H = 12 * 12$
特征图尺寸：3*3
降采样倍数s：4
关键点坐标g：（4，4）
1、原图翻转gf：（7，7）
2、网络降采样：gfr：（7/4，7/4）
3、假设网络完全拟合，特征层坐标翻转，pr：（5/4，5/4）
4、预测坐标映射回原图，p：（5，5）
预测坐标与真值产生偏差。
根因分析：
由于坐标映射出现偏差，坐标11，映射到坐标11/4，坐标3无原图映射点，下采样后坐标不应为除4，应为（12-1）/（4-1），即坐标11映射到坐标3.经过纠正后，误差可消除。

无偏关键点格式转换

无偏关键点格式转换；其中有两种方案：
1、结合分类与回归偏移；其中分类分支为圆形区域，回归分支为x、y两方向坐标偏置。
在这里插入图片描述

2、分类格式。生成高斯map。测试时，复用DARK中decoding模块，如式38，进行坐标矫正，可参考之前文章.
在这里插入图片描述

实验结果

适用于bottom-up方法以及top-down方法，在bottom-up方法上耗时有提升；top-down方法上耗时无影响。
在这里插入图片描述

总结

从数据无偏角度出发，有效提升算法性能。

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
姿态估计-UDP论文解读

UDP-魔鬼藏在细节里，解决关键点估计偏差问题
复制链接

扫一扫

专栏目录

‘Atlas’ CSDN认证博客专家 CSDN认证企业博客

码龄6年

103: 原创

1995: 周排名

7万+: 总排名

46万+: 访问

: 等级

3168: 积分

1万+: 粉丝

362: 获赞

174: 评论

1841: 收藏

私信

关注

分类专栏

论文详解 72篇
工程实践 6篇
数据集 1篇
NLP 1篇
3D重建 5篇
通用分割 6篇
实例分割 10篇
数据生成 23篇
跨模态 25篇
虚拟试衣 6篇
图像修复 1篇
工具 1篇
视频生成 7篇
文本识别 1篇
Transformer 8篇
风格迁移 1篇
自监督 1篇
姿态估计 3篇
联邦学习 2篇
姿态迁移 2篇
image translation 1篇
GNN 1篇
深度学习 45篇
机器学习 3篇
Python 6篇
anaconda 1篇
数据结构 1篇
安装 1篇
目标检测 10篇

最新评论

BLIP2-图像文本预训练论文解读
失落的艺术: 这个query embeding和输入图像经过ImageEncoder得到的向量是一个东西吗？还是另外又增加了一个随机向量Query embeding？
BLIP2-图像文本预训练论文解读
巷猫和斑马: 可学习的query embedding就是Q-Former中图像编码器的输入，因为在BLIP2中Image Encoder被冻结了，所以无法通过调整Image Encoder的参数使得学习到的图像特征向量与文本特征向量align，所以使用可学习的Query作为代替，它可以同时考虑图像和文本的特征，以此作为align的桥梁
BLIP2-图像文本预训练论文解读
小喜久: 想问一下，在Q-Former左侧的图像transformer中的可学习query embedding是什么呀
虚拟试衣-DiOr论文解读
m0_59079608: 您好，请问您部署好了吗，可以请教下怎么部署的吗？
BLIP使用教程
DRACO于: 你好，cannot import name BlipProcessor这种是什么原因，单独import transformer是没问题的，也尝试过更新upgrade，已是最新版本

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。