【论文阅读】【3d目标检测】point transformer

最新推荐文章于 2024-06-23 14:22:40 发布

Lukas88664

最新推荐文章于 2024-06-23 14:22:40 发布

阅读量549

点赞数

分类专栏：论文阅读文章标签：计算机视觉深度学习神经网络自动驾驶

本文链接：https://blog.csdn.net/hgj1h/article/details/124338499

版权

论文阅读专栏收录该内容

37 篇文章 11 订阅

订阅专栏

论文标题：Point Transformer

iccv2021
用transformer做点云工作
出于点云的随机性 transformer正好处理此类问题
在这里插入图片描述
但是很显然对于大规模的点云直接使用transformer计算量是巨大的所以作者提出来一种新的transformer处理形式，那便是knn查找临近点。
首先作者介绍了transformer的背景自注意力操作主要可以分为scalar和vector attention
scalar就是我们常说的注意力机制
在这里插入图片描述
而vector attention则还考虑两个token之间的关系

β为关系函数（相减） γ为一个mapping函数
而作者提出的point transformer layer则主要是利用了vector attention的模块考虑两个token之间的关系同时将位置编码加入到value中意思是既考虑位置关系又考虑值的关系：
在这里插入图片描述

具体操作是对于输入的主次点我们首先进行linear的特征编码将它们相减得到他们之间的relation，随后加上位置编码进行mlp操作后取他们的编码后的值然后进行norm的权重矩阵让权重矩阵与值函数和位置编码相乘得到编码了k临近点的输出点特征注意进行transformer的点是首先进行了一个knn查询的选取主点附近的k个点来进行value加权。

作者的位置编码采用的是相对位置再进行一个线性层编码：
在这里插入图片描述
文章的总体框架是：

可以看到网络框架主要是pointnet++的框架
SA层便是替换成了tranformer加对于knn临近点的max pooling 进行下采样而上采样感觉就完全是FP层。

后面的ablation比较了k个临近点的选取

位置编码的有效性
在这里插入图片描述
attention模块的必要性

总的来说文章创新在提出point transformer层
然而这个层主要能在点云密集的室内进行操作对于一些自动驾驶的场景点云十分稀疏在这些场景下使用knn查询临近点是不明智的而且计算量巨大。
位置编码的方式可以学习！

Lukas88664

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【论文阅读】【3d目标检测】point transformer

论文标题：Point Transformericcv2021用transformer做点云工作出于点云的随机性 transformer正好处理此类问题但是很显然对于大规模的点云直接使用transformer计算量是巨大的所以作者提出来一种新的transformer处理形式，那便是knn查找临近点。首先作者介绍了transformer的背景自注意力操作主要可以分为scalar和vector attentionscalar就是我们常说的注意力机制而vector attention则还
复制链接

扫一扫

专栏目录