Point Transformer 论文笔记

Torres_9_cfc

已于 2022-05-22 21:47:40 修改

阅读量216

点赞数

文章标签：深度学习算法人工智能

于 2022-05-20 00:24:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/torres9_1125/article/details/124874957

版权

本文探讨如何利用self-attention机制从高维低信息密度的点云中提取有效特征。通过多层处理，包括最远点采样（Farthest Point Sampling）进行下采样，结合MLP进行特征融合与上采样，最终实现点云的高效表示。点云的特性使其在空间信息中具有独特优势，而self-attention则有助于捕捉全局上下文。

摘要由CSDN通过智能技术生成

本文思想利用self-attention这个机制来帮助我们在这些点云中提出一个好的feature来解决下游任务中的困难
点云高维低信息密度
点云区别于像素点这个点中包含这个点的信息还有这个点在空间中的位置信息

对于任意一个数据点xi首先先找他的最近的k个点，采取knn算法取得的点的集合称为Xi

第一层输入n个点，每个点产生32个vector作为feature

第二层降采样点减少为1/4但是深度变深了为64

……

第五层降采样点减少为1/256但是深度变深了为512

第六层升采样减少深度

……

最后经过MLP把32最为最后的输出

什么是farthest point sampling 最远点采样

随机选择一个点开始作为我采样需要保留的一个点 s0
计算其他所有的点到这个点s0的一个距离
选择已经sampling的这个点最远的点s1加到这个集合里如{s0，s1}
如此重复计算集合外的点距离集合内最远的点是哪个，并加入
不断重复直到有N个点达到采样结果并结束

下采样过程

通过最远点采样将p1个点变为p2个点，与此同时将p1中所有点的feature经过mlp输出p1个vector

因为最终输出p2个点因此我们要做一个pooling 就是使用KNN找到p2这个点最近的几个邻居，并将这几个最近的点拿出来做一个max pooling，最终得到一个feature y

输入input 1(x1,p1)和input 2(x2,p2)重新合并成output(y,p2)

首先经过全连接层，此时p1大小远远小于p2，p1通过trilinear interpolation做线性插补，最后做一个相加

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。