CVPR 2019 Self-Supervised Learning of 3D Human Pose using Multi-view Geometry 算法研究

该博客详细介绍了CVPR 2019年一篇关于自监督学习3D人体姿态估计的论文。通过多视角几何,即使在没有相机外参的情况下,也能利用两个连续图像对训练网络。首先输入多视角图像,然后通过预训练的ResNet+反卷积网络生成体素热图,并利用soft argmax获得2D和3D姿态。接着,当相机外参可用时,利用照相机参数和RANSAC算法进行三维重建;若不可用,则通过基本矩阵和本质矩阵求解。最后,通过平滑L1损失进行优化和细化单元(RU)的微调。
摘要由CSDN通过智能技术生成

在这里插入图片描述

step 1 input

n n n个相机( n ≥ 2 n≥2 n2),同时对场景中的人拍照,连续相机的baseline较小

https://blog.csdn.net/zhang11wu4/article/details/41827073

产生 I 1 , I 2 , . . . I n I_1,I_2,...I_n I1,I2,...In张图片,相邻的图像两两产生图像对,就是训练集

t r a i n i n g _ d a t a : { ( I i , I i + 1 ) ∣ i = 1 , 2 , . . . , n − 1 } training\_data:\{(I_i,I_i+1)|i=1,2,...,n-1\} training_data{ (Ii,Ii+1)i=1,2,...,n1}
(文中以n=2举例说明训练流程)

step 2

上下分支都有同样的 pose,estimator 网络,ResNet + 反卷积,在MPII 训练集上预训练。
p o s e   e s t i m a t o r 网 络 pose\,estimator 网络 poseestimator

在这里插入图片描述

生成体素热图:

H ^ , H ∈ R w × h × d ( × j × i ) \hat{H},H\in\mathbb R^{w\times h \times d(\times j \times i)} H^,HRw×h×d(×j×i)

  • w , h w,h w,h :spatial size after deconvolution
  • d d d: depth resolution define as a hyper parameter

使用soft argmax函数。

https://blog.csdn.net/qq_38682032/article/details/88607568

s o f t   a r g m a x : φ ( ⋅ ) soft\,argmax:\varphi(\cdot) softargmax:φ()
得到 3D pose (上分支)和2D pose(下分支)
3 D   p o s e :

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值