单张图像三维人脸重建必备入门face3d--pipeline

最新推荐文章于 2023-09-01 10:45:13 发布

深度之眼

最新推荐文章于 2023-09-01 10:45:13 发布

阅读量1.3k

点赞数 2

分类专栏：深度学习干货粉丝的投稿人工智能干货文章标签： 3d 深度学习计算机视觉

本文链接：https://blog.csdn.net/weixin_42645636/article/details/128339411

版权

深度学习干货同时被 3 个专栏收录

471 篇文章 154 订阅

订阅专栏

人工智能干货

444 篇文章 24 订阅

订阅专栏

粉丝的投稿

200 篇文章 2 订阅

订阅专栏

作者：小灰灰来源：投稿
编辑：学姐

上期传送门👉单张图像三维人脸重建必备入门face3d—3DMM

三维人脸的必备入门就要看Yao Feng写的https://github.com/YadiraF/face3d 这个代码主要介绍了3D人脸的一些功能，处理网格数据，生成3D人脸，从单张二维人脸图片重建三维图像，face3D是个非常轻量化的，而且都是用numpy写的。

下载代码：

git clone https://github.com/YadiraF/face3d
cd face3d

编译c++文件

cd face3d/mesh/cython
python setup.py build_ext -i

准备BFM文件：

https://github.com/YadiraF/face3d/blob/master/examples/Data/BFM/readme.md

接下来就可以运行下面8个例子。

运行python 1_pipeline.py

运行出结果

接下来对 1 pipeline的详细解读。

这个算法主要介绍了一些常用的技术，投影，旋转，平移，变换等，pipeline输入是一个三维人脸，投影到二维图片，对原始的三维人脸做一些光照，旋转，平移等一些操作，然后投影到二维图像中，并进行着色。1_pipeline做的就是这样的操作。上面的图片就是渲染出来的操作，输入就只有正脸，没有什么光照，就只有顶点和纹理的信息。这部分将会理解三维变换到二维是怎么做的。

导入三维模型

我们首先导入三维模型，看看三维模型里面存储的数据。

上面的代码就是导入三维模型，读取顶点信息vertices，顶点上的颜色信息colors，三角面片信息triangles。

根据debug结果可看到，vertices=-57269.51394714276 35239.70262979373 81402.35405980109（shape=（53215，3））表示它的三维顶点x，y，z的值，colors=0.6821081325185221 0.48736642660892804 0.39795203018737824（shape=53215,3）表示顶点x,y,z的点所表示的颜色信息，r,g,b的值，triangles=0 130 1(shape=105840,3)表示顶点序列0，130，1三个顶点序列连接起来构成的三角面片。

上图默认序列是从0开始，按顺序向下数到0到53214总共53215个顶点。

可以看到，导入的模型库的可视化为：

modify vertices

s = 180/(np.max(vertices[:,1]) - np.min(vertices[:,1]))

是将x,y,z中的y的最大值减去最低值，求得比例系数，可得

输入的三维模型是一个正脸的模型，接下来我们对原始的正脸进行旋转，

这个是对人脸进行pitch, yaw, rol角度的设置，具体详情可看

https://www.cnblogs.com/xiaoxiaoqingyi/p/6932008.html

改变pitch, yaw, rol的不同角度可得。

angle2matrix

接下来看，旋转矩阵angle2matrix([0, 30, 0])进到函数可看到：

旋转的角度x,y,z假设绕x轴旋转，pitch代表抬头，点头，yaw摇头，z表示歪头。

x, y, z = np.deg2rad(angles[0]), np.deg2rad(angles[1]), np.deg2rad(angles[2])

表示将角度信息转换为弧度信息。

接下来绕x，y,z旋转矩阵可表示：

「可最终得到的旋转矩阵为：」

R=Rz.dot(Ry.dot(Rx))

平移t = [0, 0, 0] 那么s,r,t都有了，接下来对顶点做操作

similarity_transform

是根据s,r,t进行操作，先对顶点进行旋转矩阵相乘，在乘缩放因子，在加偏移，可得到

transformed_vertices（shape=53215，3）

「可视化为：」

左图为无颜色，右图为有颜色。

modify colors/texture(add light)

这个是颜色的信息，在已经有r,g,b的颜色信息上进行处理，为什么要进行处理，因为要进行颜色的渲染，需要使用到光照模型，将某些地方进行打光，首先要确定打光的位置点。

light_positions = np.array([[-128, -128, 300]])

这行代码是确定光照的位置放在-128, -128, 300点上。为什么要设置二维数组，是因为有可能有多个光点。

light_intensities = np.array([[1, 1, 1]])

是r,g,b三个光照的强度，也就是发的什么光，例如我们将[[1, 1, 1]] 变换成[[1, 0, 1]]，可得下图：

add_light

传参为：transformed_vertices, triangles, colors, light_positions, light_intensities)

这个函数是对原始的颜色进行处理，我们需要用到转换后的顶点transformed_vertices，三角剖分triangles，原始的颜色colors，light_positions光的位置，light_intensities对光的强度。

第一步：我们求三维人脸顶点所对应的法向量normal，

normals = get_normal(vertices, triangles) # [nver, 3]

我们将三角形的第一列，第二列，第三列取出来，得到点的信息，得到向量，将图片中的向量进行X乘。得到垂直于三角平面的法向量。

但是我们要求点的法向量。将周围的三角形的法向量加起来求平均值就是点的法向量。

normal = np.zeros_like(vertices, dtype = np.float32).copy() # [nver, 3]
mesh_core_cython.get_normal_core(normal, tri_normal.astype(np.float32).c

opy(), triangles.copy(), triangles.shape[0])

「这段函数就是求取每个点的法向量。」

得到的法向量进行归一化。

normal = normal/np.sqrt(mag[:,np.newaxis])

将模长为0时，强制设置成1，

mag[zero_ind] = 1;

得到每一点的法向量

normals = get_normal(vertices, triangles) # [nver, 3]

「第二步我们将得到的法向量，根据光照模型，添加光照。」

就是对r,g,b点根据法向量求取夹角。

direction_to_lights = vertices[np.newaxis, :, :] - light_positions[:, np.newaxis, :] # [nlight, nver, 3]

nlight表示的是有几种光源，never表示一个光源到53215到的向量。

direction_to_lights_n =np.sqrt(np.sum(direction_to_lights**2, axis = 2)) # [nlight, nver]

将向量进行归一化，

direction_to_lights = direction_to_lights/direction_to_lights_n[:, :, np.newaxis]

除以模长，此时得到的就是真正的光照到点的向量。

我们有了每一个点的法向量normals ，光线入射的向量direction_to_lights，那么就可以求得每一个点的夹角。夹角越大，光线更弱，

normals_dot_lights = normals[np.newaxis, :, :]*direction_to_lights # [nlight, nver, 3]
normals_dot_lights = np.sum(normals_dot_lights, axis = 2) # [nlight, nver]

去做点积，然后求和就可以求得cos值。

然后将颜色值r,g,b跟cos相乘，再跟关照强度进行相乘。

diffuse_output = colors[np.newaxis, :, :]*normals_dot_lights[:, :, np.newaxis]*light_intensities[:, np.newaxis, :]

我们将几束光进行求和。

diffuse_output = np.sum(diffuse_output, axis = 0) # [nver, 3]

得到光线到点的颜色值。

接下来对小于0的取1，主要用来得到暗的。

lit_colors = diffuse_output # only diffuse part here.
 lit_colors = np.minimum(np.maximum(lit_colors, 0), 1)

最终我们得到光照的颜色值。可视化如图：

左边是原始图像，右边是添加光照之后的图像。

modify vertices(projection. change position of camera)

我们将顶点，颜色都进行变换了，那么接下来就是将三维模型渲染到二维图片。那么一般将现实世界进行拍照的时候，我们就要拿相机，进行拍照，所以首先的知道相机的位置。

camera_vertices = mesh.transform.lookat_camera(transformed_vertices, eye = [0, 0, 200], at =np.array([0, 0, 0]), up = None)

lookat_camera是照相机在看，需要变换的点transformed_vertices，eye表示照相机的位置，at是看哪个点[0, 0, 200]，up是我的照相机向上看的方向。

将拼接成一个矩阵，将矩阵减去一个eye，然后去乘一个旋转矩阵，返回的就是人脸的位置回归到照相机的位置，接着我们做了一个正交投影。

render(to 2d image)

这个主要是将坐标进行做一个变换。下面的代码就是做坐标的平移。

得到的值就是x,y的坐标

可以看到我们得到的是53215，3个点，但是我们想要变换成图片，大小应该是256*256的尺寸，怎样将53215个点放在图像上，就得渲染图像。

rendering =  mesh.render.render_colors(image_vertices, triangles, lit_colors, h, w)

我们渲染图片需要点image_vertices，triangles, lit_colors, h, w

render_colors_core

主要是渲染图片，传入图片，点，三角面片。我们将三角形的三个点，得到三角形的内部的，进行三角剖分，得到每个三角形的索引.tri_p0_ind,tri_p1_ind，tri_p2_ind.

根据三角形的索引取得三个点的坐标，p0.x,p1.x,p2.x 算的横轴坐标的最大值最小值，x_min，x_max，y_min，y_max。用来求取三角形内部的像素值是多少。遍历矩阵里面三角形，求取的像素值。

p.x = x; p.y = y;默认为当前的点的像素值。通过isPointInTri c++函数来实现。

p0_color = colors[ctri_p0_ind + k];

p1_color = colors[ctri_p1_ind + k];

p2_color = colors[c*tri_p2_ind + k];

「通过三角面片的三个点求得colors值。」

「最终求得图像的点的像素」

p_color = weight[0]*p0_color + weight[1]*p1_color + weight[2]*p2_color;
 image[y*w*c + x*c + k] = p_color;

就可以求得。

最终取得的图片如下图

总结

整个流程就是将一个三维的人脸经过一系列的处理，旋转，平移，光照的流程。详细课程就请来深度之眼的三维重建paper专题来学习。

三维人脸重建经典论文解读👇👇👇点击卡片学起来

深度之眼

关注

2
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
单张图像三维人脸重建必备入门face3d--pipeline

整个流程就是将一个三维的人脸经过一系列的处理，旋转，平移，光照的流程。
复制链接

扫一扫

专栏目录

单张图像三维人脸重建必备入门face3d--pipeline

导入三维模型

modify vertices

angle2matrix

similarity_transform

modify colors/texture(add light)

add_light

modify vertices(projection. change position of camera)

render(to 2d image)

render_colors_core

总结

“相关推荐”对你有帮助么？