Recovering Non-Rigid 3D Shape from Image Streams

最新推荐文章于 2023-04-12 20:41:08 发布

xzx9

最新推荐文章于 2023-04-12 20:41:08 发布

阅读量275

点赞数

分类专栏：论文阅读笔记文章标签：三维视觉

本文链接：https://blog.csdn.net/weixin_43184669/article/details/120993582

版权

论文阅读笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

论文下载通道

Abstract

提出本论文主要解决的问题是： $\text{recovering 3D non-rigid shape models from image sequences}$ ，即从图像序列（比如视频）中恢复三维非刚性形状模型。论文提出了一种基于非刚性模型的新技术，其中每一帧的3D形状是一组 基形状(basis shape) 的线性组合。在该模型下，跟踪矩阵具有较高的秩，并可通过三步分解得到位姿、位形和形状。在基于视频序列构建说话者面部模型中准确率较高。

Introduction

该技术应用在谈话者视频中表现良好，可以构建出人脸（面部表情和嘴唇动作等）的模型。在Tomasi和Kanade的分解技术中，从图像序列中恢复出一个形状矩阵(shape matrix)。在正投影(orthographic projection) 下，2D的追踪矩阵秩为3，且可以通过奇异值分解(SVD) 分解为3D姿态和3D形状。但他们的技术不能用在非刚性的变形的物体上。
主要的方法都是基于 $\text{PCA}$ ，如果物体变形的自由度为 $K$ ，则形状测量的协方差矩阵的秩为 $K$ ，且主要的变化可以通过 $\text{SVD}$ 来恢复。
每一帧中的3D形状是 $K$ 个基础形状的线性组合。在当前模型下，通过使用 $\text{SVD}$ ，秩为 $3 K$ 的2D追踪矩阵可以被分解为3D姿态、结构和3D基础形状。

Previous Work

主要介绍已有的相关技术的局限性，这些技术都不能在不进行任何初始化的情况下从单视图2D视频流估计非刚性3D形状模型。

Factorization Algorithm

$\text{key-frame basis set}$ ： $S_1,S_2,\cdots,S_k$ ， $S_i$ 是一个描述 $P$ 个点的 $3\times P$ 的矩阵。
$\text{the linear combination of this basis set}$ ：
$S=\sum_{i=1}^{K}{l_i·S_i}$
通过正投影，构造 $S$ 的 $P$ 个点被映射到 $2 D$ 图像上的点 $u_i,v_i)$ ：
在这里插入图片描述
其中， $R$ 是摄像头旋转矩阵， $T$ 是摄像头平移，投影的规模记录在 $l_1,\cdots,l_K$ 中。与Tomasi和Kanade相同的做法，通过减去所有2D点的平均值来消除 $T$ ，之后就可以使得 $S$ 位于中心的原点。
以矩阵乘积的形式重写线性组合：
在这里插入图片描述
把 $N$ 帧中所有的2D点表示为：

可写成：

Basis Shape Factorization

$W$ 矩阵的秩为 $3 K$ ，可以被分解为 $Q$ 和 $B$ 。在只考虑前 $3 K$ 奇异向量和奇异值（在 $\text{U,D,V}$ 中），通过 $\text{SVD}$ ，可以进行分解：
在这里插入图片描述

Factoring Pose from Configuration

Adjusting Pose and Shape

Experiments

Discussion

xzx9

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Recovering Non-Rigid 3D Shape from Image Streams

论文下载通道Abstract提出本论文主要解决的问题是：recovering 3D non-rigid shape models from image sequences\text{recovering 3D non-rigid shape models from image sequences}recovering 3D non-rigid shape models from&nbs
复制链接

扫一扫

专栏目录