[ECCV2020]3D Bird Reconstruction: a Dataset, Model, and Shape Recovery from a Single View

深蓝蓝蓝蓝蓝

已于 2022-09-08 09:43:28 修改

阅读量355

点赞数

分类专栏： 3D物体重建论文阅读文章标签：人工智能深度学习

于 2022-08-31 17:02:35 首次发布

本文链接：https://blog.csdn.net/wrk226/article/details/126624149

版权

论文阅读同时被 2 个专栏收录

90 篇文章

订阅专栏

3D物体重建

9 篇文章

订阅专栏

该研究介绍了一个用于鸟类行为分析的多视角数据集，包含15只八哥的125个时刻的1000张照片，以及详细的标注。此外，作者构建了一个3D鸟类模板模型，并提出了一个从单视角图像进行3D重建的四步方法，包括多视角对齐、模型参数预测、语义特征预测和单视角优化。此工作为鸟类形态学研究和计算机视觉提供了新工具。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

标题：3D Bird Reconstruction: a Dataset, Model, and Shape Recovery from a Single View

链接：https://arxiv.org/pdf/2008.06133

本文首先是提供了一个可以用于分析鸟类行为学的数据集，然后为鸟类设计了一套精细的3D参数化模型，最后提出了一套算法来将3D模型拟合到单视角鸟类图像。

数据集

这个数据集是由8个在同一鸟笼中的相机捕获的，所有的鸟都是八哥（共15只）。一共有125个时刻，1000张照片。所有照片中的个体都有对应的mask和bbox标注（6355个）。其中18个时刻中的1031个mask还标注了keypoints（12个语义点：嘴尖，左右眼，脖子，后颈，左右翅根，左右翼尖，左右爪，尾尖）。其余信息参见原文。

3D模板

作者首先从CGTrader Marketplace website上下载了一个可动的3D鸟模型。原模型包含了18k个顶点，13k个面。作者在此基础上移除了如羽毛，眼镜等描述细节的顶点，最后将模板删减为3932个顶点，5684个面和25个关节点（其中有一个根节点用于表示相机角度）。关节点对应的蒙皮权重用的是原模型的（即人工设定的）。除此以外，作者还提取了16个基于网格的3D关键点，对应的位置由选定的四个网格顶点位置的均值决定。

在此基础上，作者设定了几组参数用于描述这个模型：

alpha：骨骼长度，即子节点与父节点间的距离

theta：姿势参数

gamma：物体的全局位移

K,R,t：相机的内参（焦距等），旋转和位移

由于作者发现翅膀张开的情况使用LBS难以拟合，因此作者在实际操作中使用了两套模板，一个张开翅膀一个合起翅膀的。但是他们除了姿态以外别的参数全都一样。