3DMatch数据集

最新推荐文章于 2024-12-25 10:33:29 发布

zhulf0804

最新推荐文章于 2024-12-25 10:33:29 发布

阅读量1.4w

点赞数 23

分类专栏：点云文章标签： 3DMatch数据集 3DMatch 点云点云数据集点云论文

本文链接：https://blog.csdn.net/zhulf0804/article/details/110259055

版权

点云专栏收录该内容

24 篇文章

订阅专栏

关于

更多点云资源点击这里，包括250篇近几年的点云论文及数据集，包括点云配准、点云分割、点云检测、点云补全、无监督学习等方向。
下述3DMatch数据集的统计分析的代码均可在这里访问。

一、3DMatch数据集简介

3DMatch数据集收集了来自于62个场景的数据，其中54个场景的数据用于训练，8个场景的数据用于评估，其具体名称查看train.txt和test.txt。3DMatch数据常用于3D点云的关键点，特征描述子，点云配准等任务。

官方主页 | 3DMatch: Learning Local Geometric Descriptors from RGB-D Reconstructions [CVPR 2017]

3DMatch原始数据集: 下载地址，共包括64个.zip文件。

以其中一个场景7-scenes-stairs为例，介绍其数据格式，如下截图所示，原始的3DMatch数据集包括两个.txt文件，多个seq文件夹，每个seq文件夹下包括多帧的.color.png, .depth.png, .pose.txt，可以看到，
其本身是不包括点云数据的，但是可以由这些数据生成点云数据(ply)，一般是50帧-100帧生成一个点云数据，生成点云的代码可以参考fuse_fragments_3DMatch.py。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VZwEwdzs-1606525910251)(./images/7-scenes-stairs.png)]

下面介绍3DMatch的训练集，包括FCGF和D3Feat处理的训练集。

二、3DMatch的训练集(FCGF)

3DMatch训练集来自54个场景，详细类别名称参见train.txt。每个场景均由1个seq或者多个seq的数据组成。这里以FCGF
网络使用的数据格式为例介绍3DMatch数据集。

首先，从这里下载训练集，下载解压后可以得到401个txt文件和2189个npz文件。2189个npz对应每个点云数据，包括(x, y, z)及对应的(r, g, b)信息，其中命名规则是场景@seqid-id，例如7-scenes-chess@seq-01_000.npz，表示此数据来自7-scenes-chess场景的seq-01，编号为000。401个txt表示这些npz的点云数据是如何关联的，其命名规则为场景@seqid-overlap，如7-scenes-chess@seq-01-0.30.txt表示7-scenes-chess场景的seq-01下的overlap大于0.30的数据，打开此文件后，可以看到如下信息:

7-scenes-chess@seq-01_000.npz 7-scenes-chess@seq-01_001.npz 0.886878
7-scenes-chess@seq-01_000.npz 7-scenes-chess@seq-01_002.npz 0.636459
7-scenes-chess@seq-01_000.npz 7-scenes-chess@seq-01_003.npz 0.825012
7-scenes-chess@seq-01_000.npz 7-scenes-chess@seq-01_004.npz 0.783642

每一行表示点云之间的对应关系，如第一行表示点云7-scenes-chess@seq-01_000.npz和7-scenes-chess@seq-01_001.npz具有0.886878的overlap。可视化结果如下，第一个图中的红色的点云是7-scenes-chess@seq-01_000.npz，蓝色的点云是7-scenes-chess@seq-01_001.npz，可以看到两者是对齐的；第二个图是这两个点云的rgb信息的可视化。

在这里插入图片描述

统计了一下，54个场景总共提供了7960对点云。

上述的统计信息的相关代码在trainset_fcgf.py

三、3DMatch训练集(D3Feat)

下载D3Feat训练使用的3DMatch数据集，解压后是6个.pkl文件，分别是
3DMatch_train_0.030_keypts.pkl, 3DMatch_train_0.030_overlap.pkl, 3DMatch_train_0.030_points.pkl, 3DMatch_val_0.030_keypts.pkl, 3DMatch_val_0.030_overlap.pkl和
3DMatch_val_0.030_points.pkl，可以通过这里查看这些.pkl文件是如何产生的。

3DMatch_train_0.030_keypts.pkl存储了什么信息 ?

点云名(str, 如sun3d-brown_bm_1-brown_bm_1/seq-01/cloud_bin_0) -> 点云(ndarray, n x 3)

总共有3933个点云数据，点云点最少的是850个，点云点最多的是197343，平均点云点数量是27127。
3DMatch_train_0.030_overlap.pkl存储了什么信息 ?

点云对(str, 如7-scenes-pumpkin/seq-07/cloud_bin_11@7-scenes-pumpkin/seq-08/cloud_bin_2) -> overlap值(float)

总共有35297个点云对，overlap的最小值为0.30，最大值0.995，平均值为0.515。
3DMatch_train_0.030_points.pkl存储了什么信息 ?

点云对(str, 如analysis-by-synthesis-office2-5b/seq-01/cloud_bin_34@analysis-by-synthesis-office2-5b/seq-01/cloud_bin_35) -> 映射关系(ndarray, m x 2)
可视化pairs中的点云和对应关键点

在这里插入图片描述

左图为两个具有overlap的点云的可视化，中间和右边的可视化是分别在红色和绿色点云上添加了对应点(蓝色区域)(来自于3DMatch_train_0.030_points.pkl)的可视化结果。

上述相关代码在trainset_d3feat.py。(为什么D3Feat的训练集中点云和点云对数量比FCGF中的点云和点云对数量多这么多 ?还待验证。)

四、3DMatch的测试集

3DMatch的测试集包括以下8个场景，其中每个场景对应两个文件夹。以7-scenes-redkitchen为例，它包括7-scenes-redkitchen和7-scenes-redkitchen-evaluation两个文件夹，7-scenes-redkitchen文件夹下存放的是点云数据，命名格式均为cloud_bin_*.ply，共包括60个点云数据；7-scenes-redkitchen-evaluation/gt.log存放了correspondences点云对，组织格式为:

0    1   60
 9.96926560e-01   6.68735757e-02     -4.06664421e-02     -1.15576939e-01
-6.61289946e-02   9.97617877e-01      1.94008687e-02     -3.87705398e-02
 4.18675510e-02  -1.66517807e-02      9.98977765e-01      1.14874890e-01
 0.00000000e+00   0.00000000e+00      0.00000000e+00      1.00000000e+00
0    2   60
 9.54999224e-01   1.08859481e-01     -2.75869135e-01     -3.41060560e-01
-9.89491703e-02   9.93843326e-01      4.96360476e-02     -1.78254668e-01
 2.79581388e-01  -2.01060700e-02      9.59896612e-01      3.54627338e-01
 0.00000000e+00   0.00000000e+00      0.00000000e+00      1.00000000e+00

0 1 60中的0和1表示cloud_bin_0.ply和cloud_bin_1.ply点云是成对的，60表示总共包括有60个点云数据(前面也提到过)，下面四列表示cloud_bin_1.ply -> cloud_bin_0.ply的变换矩阵。

可视化变换后的点云，红色的表示cloud_bin_0.ply点云，蓝色的表示对cloud_bin_1.ply变换后的点云，可视化结果显示两者基本重叠:

在这里插入图片描述

其它场景的统计数据如下，可视化和统计信息的代码均可通过test_set.py实现。

名称	点云数量	Pairs数量
7-scenes-redkitchen	60	506
sun3d-home_at-home_at_scan1_2013_jan_1	60	156
sun3d-home_md-home_md_scan9_2012_sep_30	60	208
sun3d-hotel_uc-scan3	55	226
sun3d-hotel_umd-maryland_hotel1	57	104
sun3d-hotel_umd-maryland_hotel3	37	54
sun3d-mit_76_studyroom-76-1studyroom2	66	292
sun3d-mit_lab_hj-lab_hj_tea_nov_2_2012_scan1_erika	38	77
总计	433	1623

上述的统计信息的相关代码在test_set.py

五、3DMatch数据集的评估指标

评估指标主要基于FCGF [ICCV 2019]，评估代码请参考https://github.com/chrischoy/FCGF/blob/master/scripts/benchmark_3dmatch.py。但Registration Recall的实现我感觉有问题，待日后再做补充吧。

Feature-match Recall

$\frac{1}{M} \Sigma_{s=1}^M 1([\frac{1}{|\Omega_s|}\Sigma_{(i, j) \in \Omega_s}1(||T^* \text{x}_i - \text{y}_j|| < \tau_1) ] > \tau_2)$

$M$ 表示pairs点云对的数量， $1$ 表示指示函数， $\Omega_s$ 是第 $s$ 个pair的correspondences， $T^*$ 表当前pair点云的G.T.的R,t变换。 $\text{y}_j$ 是 $\text{x}_i$ 在 $Y$ 中选择的Feature Distance最小的点，即 $\text{y}_j = \arg \min_{\text{y}_j} ||F_{\text{x}_i} - F_{\text{y}_j}||, \text{y}_j \in Y$ 。 $\tau_1$ 和 $\tau_2$ 是两个超参数，常取值 $\tau_1 = 0.1$ ， $\tau_2 = 0.05$ 。

简单的说，就是有M个点云对，对每一个点云对做一个是特征好/坏的判断: 在真实R,t的情况下，计算 $(\text{x}_i, \text{y}_j)$ 距离小于 $\tau_1$ 的比例r，如果r大于 $\tau_2$ ，则表示这个点云特征好，否则特征是坏的。
Registration Recall

$E_{\text{RMSE}} = \sqrt {\frac{1}{\Omega_*}\Sigma_{(\text{x}^*, \text{y}^*) \in \Omega_*} ||\hat T_{i, j}\text{x}^* - \text{y}^*||^2}$

$\Omega_*$ 表示 $(i, j)$ 点云对中correspondences的数量， $(\text{x}^*, \text{y}^*)$ 表示G.T.的pair， $\hat T_{i, j}$ 表示基于 $(i, j)$ 点云对预测的R,t变换。

对于具有至少30% overlap的点云对，如果 $E_\text{RMSE} < 0.2$ ，则表示这是一个正确的点云对。