【计算机视觉】简述对EQ-Net的理解

最近又看了一些点云分割的文章,近两年点云分割的文章是真的少,不知道是不是点云分割算法接近了末端。这篇文章主要提出了一个基于查询方法的统一范式,它解决了一些不仅仅是点云分割的问题,还解决了三维点云分类和三维目标检测的问题。
在这里插入图片描述
文章整体结构如上图,可以大体将EQ-Net分为三个部分,第一部分成为嵌入部分(Embedding Staget),该部分主要嵌入输入点云,它的一个优势是它不仅仅可以嵌入基于点的网络还能嵌入基于体素的网络,大大提高了其泛化性。通过该部分,网络可以得到下采样的支持点S和支持点特征Fs。第二部分是查询阶段,该部分的输入有两部分,一部分是支持点,另一部分是查询点,该部分主要是通过查询原始数据集,点云分割的话基本上就是将整个点云数据集输入到网络中。该阶段主要经过Q-Net网络,得到一个支持点特征FQ。如下图。
在这里插入图片描述
上图可以解析成两部分,黄色代表的是Q-Decoder块,绿色代表的是Q-Encoder块,他们具体层数可以通过消融实验确定。黄色部分主要是利用的Transformer中的交叉注意力,因为它的输入不仅仅有支持点,还有查询点。绿色部分主要是自注意力,它的输入只有支持点,通过几层注意力层后送入不同的任务头(Task Head)完成相应的三维任务。
在这里插入图片描述
该网络在S3DIS的6-fold上达到了77.5的一个水平,可以说是非常的高了,而且EQ-Net可以嵌入不同的一个网络得到一个支持点的特征,所以该部分设计还是比较好的。
在这里插入图片描述
论文地址:https://arxiv.org/pdf/2203.01252v3.pdf

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
计算机视觉是研究如何使计算机能够理解和解释图像和视频的领域。它的理论框架主要包括以下几个方面: 1. 图像获取与预处理:计算机视觉的第一步是获取图像或视频,并对其进行预处理。这包括图像采集、去噪、图像增强、颜色空间转换等操作。 2. 特征提取与表示:在计算机视觉中,特征提取是非常重要的一步,它通过从图像中提取有用的信息来描述图像。常用的特征包括边缘、角点、纹理等。特征表示则是将提取到的特征转化为计算机可以理解和处理的形式,如向量或矩阵。 3. 目标检测与识别:目标检测是指在图像或视频中定位和识别特定的目标或物体。常见的目标检测方法包括基于特征的方法、基于深度学习的方法等。目标识别则是指将检测到的目标与已知的类别进行匹配和分类。 4. 图像分割与语义理解:图像分割是将图像划分为不同的区域或对象,以便更好地理解图像的结构和内容。语义理解则是对图像进行语义级别的理解,如理解图像中的场景、物体和动作等。 5. 三维重建与姿态估计:三维重建是指从二维图像中恢复出物体的三维结构和形状。姿态估计则是估计物体在三维空间中的姿态和位置。 6. 视觉跟踪与动作分析:视觉跟踪是指在视频序列中跟踪目标的位置和运动。动作分析则是对视频中的动作进行识别和分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

面向发疯编程@Lyx

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值