论文学习:I2L-MeshNet: Image-to-Lixel Prediction Network for Accurate 3D Human Pose and Mesh Estimation from a Single RGB Image
摘要(Abstract):
从单张图像回归3D人体姿态和蒙版的方法绝大部分都是以直接回归相关系数的方式实现。然而直接回归参数会损失输入图像像素之间的关系并且是一个高度的非线性的映射。除此之外,此类方法不能够对预测结果的不确定性进行量化建模,这样会导致训练困难。为了解决以上问题,我们提出I2L-MeshNet,这是一个图像到线素的预测网络。本文提出的I2L-MeshNet会直接预测每个mesh顶点对应的一维热力图来代替直接回归对应的3D人体相关参数。我们基于一维热力图的方法保留了输入图像的空间信息并且可以量化输出结果的不确定性。我们对比之前的方法,展示了所提出方法的优势。我们的项目代码已经公开。
本文创新点
- 提