3D【8】鸟类重建：Learning Category-Specific Mesh Reconstruction from Image Collections阅读笔记

最新推荐文章于 2024-06-04 09:57:25 发布

DCD_Lin

最新推荐文章于 2024-06-04 09:57:25 发布

阅读量1.7k

点赞数 1

分类专栏： 3d

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linmingan/article/details/79651860

版权

本文探讨了一种从图像集合中学习特定类别（如鸟类）3D网格重建的方法。在没有对应3D模型的训练数据下，模型预测平均网格坐标偏差、相机参数和纹理UV图。训练过程涉及多种损失函数，包括特征点、掩蔽、相机参数的惩罚项等。此外，论文提出了一种预测纹理流而非直接预测纹理图的策略，以解决3D模型背面纹理的计算问题。

摘要由CSDN通过智能技术生成

该文章直接预测的是平均mesh的坐标偏差，相机参数和纹理uv图。里面有各种损失函数，很值得学习。

这篇论文还有个有意思的点，论文用的训练数据是没有对应的3D模型的（也就是一张图片没有对应的3D模型）。训练过程有点像3DMM的重建过程，即先估计3D模型，将模型渲染到2D；然后比较渲染的图片和原始图片的差异，以更新模型的参数。要将这个过程应用在神经网络中，由于渲染是不可导的，因此需要解决渲染这一步骤的求导问题。这个问题的解决可以看论文：Neural 3D Mesh Renderer

这里写图片描述

上图是模型的训练过程：图片经过encoder抽取出特征，然后预测相机参数、变形参数（平均模型的顶点坐标差值， $3D模型V=\Delta{V}（差值）+\bar{V}(平均模型)$ ）和纹理流；最后利用mask（前景背景掩蔽图）、特征点和纹理误差来更新网络参数。

损失函数

特征点

这里写图片描述
$x_i$ 是第i个训练样本真实特征点， π

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。