GOOD: A global orthographic object descriptor for 3D object recognition and manipulation论文阅读

最新推荐文章于 2024-08-09 22:59:12 发布

Lcx559

最新推荐文章于 2024-08-09 22:59:12 发布

阅读量114

点赞数

文章标签： 3d 论文阅读目标检测

本文链接：https://blog.csdn.net/Lcx559/article/details/129538869

版权

该文提出了一种新的特征描述方法——GOOD，通过点云分析获取唯一参考系。主要贡献包括设计了一种符号消歧方法和全局对象描述符，该描述符在描述性、计算效率和内存使用之间取得平衡。通过局部参考系确定点云的坐标，使用特征值分解和消歧过程来建立稳定的方向。对象描述符由投影平面的分布矩阵和熵计算得出，用于3D对象的识别和操作。实验表明，这种方法在不同数量的bin下表现稳定。

摘要由CSDN通过智能技术生成

GOOD: A global orthographic object descriptor for 3D object recognition and manipulation

Abstract

提出一种新的特征描述方法（GOOD），通过分析点云，获得特征向量的唯一参考系。

Introduction

Contribution：

设计一种新的符号消歧方法，通过分割特征向量确定明确唯一的坐标参考系。
一种使用本地参考系计算的新的全局对象描述符，它在描述性、计算时间和内存使用之间提供了很好的权衡。

Local reference frame

局部坐标系对于旋转和平移不变，对噪声具有鲁棒性，对对象的识别有着很重要的作用。
输入一个点云 $o= {p_1,p_2...p_m}$ ,其中心点可以被定义为：
$\frac{1}{m}\sum_{i=1}^mp_i$
对象的归一协方差矩阵可以定义为：
$\frac{1}{m}\sum^m_{i=1}(p_i-c)(p_i-c)^T$
在C上进行特征值分解：
$C V = E V$
其中 $\vec{v}= (v_1,v_2,v_3)$ ,包含了三个特征向量， $diag(\lambda_1,\lambda_2,\lambda_3)$ ,对应为特征值对角矩阵。
由于特征向量定义的方向不是唯一的，这导致在PAC（主干成分分析）中不可重复。
假设从一个选定参考系中开始，选定 $v_1,v_2$ 分别作为x，y轴，根据右手定则，定义z轴为 $v_1\times v_2$ ,这样就可以确定下x轴和y轴的方向，将不确定的方案减少到4个。
为了完成消歧，点云O被放置入局部坐标轴中，因此获得了具有+x和-x的点的数量，被定义为：
$S_x^+ = i:x_{p_i}>t\quad,S_x^-= i:x_{p_i}<-t,$
t=0.015m,因此在不同的实验中可以将X轴从负改为正，然后将 $S_x$ 定义为：
$S_x \begin{cases} +1, & |S_x^+|\geq|S_x^-|\\ -1, & otherwise \end{cases}$
|.|表示参数的点数，对Y轴同样使用相同的计算方法 $S_y$ ，坐标轴可以被定义为：
$S_x\centerdot S_y$
s可以是-1或1，当s=-1时，坐标轴的方向需要改变，最终的局部坐标轴（LRF）可以被定义为： $(sv_1,sv_2,v_1\times v_1 )$
消歧过程可视化：
在这里插入图片描述

Object descriptor

本节基于LRF（局部坐标轴的）几何中心计算物体的描述符，描述符由三个XOY、XOZ、YOZ三个片面上的投影生成，为了保证不同物体形状之间的比较，每个投影平面内的bin数量必须相同，每个投影平面的长度l都由轴对齐的最大加密包围框确定，通过计算每个坐标轴沿轴的最大值和最小值得到，每个投影面的bin因此被确定下来为n个，每个投影点被定义为 $\rho=(\alpha,\beta)$ , $\alpha,\beta$ 分别为到两投影面的距离，对于每行每列的联系可以被定义为：
50%
分布矩阵 $M_{n\times n}$ 由每个bin中落入的点决定，M中的值被归一化，以保证点云密度的不变。根据惯例，各个分布矩阵被转化成一个向量， $m_{1\times n^2}=[M(1,1),M(1,2),M(n,n)]$ ,三个投影图的2d分布矩阵被转化成一个3 $×n2 \times n_2$ 的向量，如下图所示：
在这里插入图片描述
在这篇文章中每个投影的熵计算如下：
$H(m)=-\sum^n_{i=1}m_ilog_2m_i$
熵最高的投影图作为描述符的前 $n^2$ 项，对于 $n^2,2n^2-1$ 项则作为方差更小的一项，方差计算公式如下：
$\sigma^2(m) = \sum_{i=1}^n(i-\mu_m)^2m_i\quad,\mu_m=\sum_{i=1}^{n^2}im_i$

方差较小则证明点的分布紧凑，比较接近向量的平均值，方差较大则相反。
通过投影还可获得目标的一些其他特征，下图中展示了可以表达出马克杯的厚度高度的信息。在这里插入图片描述

Experiment

不同数量bin下的实验：
在这里插入图片描述

Lcx559

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
GOOD: A global orthographic object descriptor for 3D object recognition and manipulation论文阅读

提出一种新的特征描述方法（GOOD），通过分析点云，获得特征向量的唯一参考系。
复制链接

扫一扫