CVPR 2019 Self-Supervised Learning of 3D Human Pose using Multi-view Geometry 算法研究

最新推荐文章于 2022-06-17 09:45:32 发布

DZzz丶

最新推荐文章于 2022-06-17 09:45:32 发布

阅读量1k

点赞数

分类专栏：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38682032/article/details/88880174

版权

该博客详细介绍了CVPR 2019年一篇关于自监督学习3D人体姿态估计的论文。通过多视角几何，即使在没有相机外参的情况下，也能利用两个连续图像对训练网络。首先输入多视角图像，然后通过预训练的ResNet+反卷积网络生成体素热图，并利用soft argmax获得2D和3D姿态。接着，当相机外参可用时，利用照相机参数和RANSAC算法进行三维重建；若不可用，则通过基本矩阵和本质矩阵求解。最后，通过平滑L1损失进行优化和细化单元(RU)的微调。

摘要由CSDN通过智能技术生成

在这里插入图片描述

step 1 input

$n$ 个相机（ $n \geq 2$ ）,同时对场景中的人拍照，连续相机的baseline较小

https://blog.csdn.net/zhang11wu4/article/details/41827073

产生 $I_1,I_2,...I_n$ 张图片,相邻的图像两两产生图像对，就是训练集

$training\_data：\{(I_i,I_i+1)|i=1,2,...,n-1\}$
(文中以n=2举例说明训练流程）

step 2

上下分支都有同样的 pose,estimator 网络，ResNet + 反卷积，在MPII 训练集上预训练。
$pose\,estimator 网络$

在这里插入图片描述

生成体素热图：

$\hat{H},H\in\mathbb R^{w\times h \times d(\times j \times i)}$

$w, h$ ：spatial size after deconvolution
$d$ : depth resolution define as a hyper parameter

使用soft argmax函数。

https://blog.csdn.net/qq_38682032/article/details/88607568

$soft\,argmax:\varphi(\cdot)$
得到 3D pose （上分支）和2D pose（下分支）

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
CVPR 2019 Self-Supervised Learning of 3D Human Pose using Multi-view Geometry 算法研究

nnn个相机（n≥2n≥2n≥2）,同时对场景中的人拍照，连续相机的baseline较小此文有介绍，应该就是距离比较近的意思 https://blog.csdn.net/zhang11wu4/article/details/41827073产生 I1,I2,...InI_1,I_2,...I_nI1,I2,...In张图片,相邻的图像两两产生图像对，就是训练集training_d...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。