Real-Time Plane Segmentation using RGB-D Cameras

Real-Time Plane Segmentation using RGB-D Cameras

1、Fast computation of local surface normals

在这里插入图片描述

直接计算x和y图像空间中相邻像素的法向量:

  1. 我们方法的基本原理是计算2个在点 p i p_i pi上与局部曲面相切的向量;
  2. 从这两个切向向量,我们可以很容易地用外积计算法向量;
  3. 计算法线最简单的方法是计算左右相邻像素之间和上下相邻像素之间的法线,如图1.a所示;
  4. 因为有噪声的数据和没有深度信息的区域(使用的相机的一个特殊特性),因此得到的法线也会受到很大的影响。为此,我们通过计算某邻域内的平均向量,对切向向量进行平滑处理。为了有效地进行平滑,我们使用了积分图像。
  5. 我们首先创建两个切向向量映射,一个用于x方向,一个用于y方向(同样是在图像空间中)。
  6. 对于每个映射的每个通道(笛卡尔x, y和z),我们计算一个积分图像,这导致总共6个积分图像;
  7. 使用这些积分图像,我们只需要2 × 4 × 3的内存访问就可以计算平均切向向量,且与平滑区域的大小无关;
    总体运行时复杂度与计算法线的点数成线性关系

补充积分图像

2、Fast plane segmentation

分两步分割局部表面法线:

  1. 对法线空间 ( n x , n y , n z ) T (n^x, n^y, n^z)^T (nx,ny,nz)T中的点进行聚类,得到候选平面聚类
  2. 在距离空间(平面与原点的距离)中聚类局部表面法向相似的平面

2.1、Initial segmentation in normal space

在这里插入图片描述

在最初的聚类步骤中,我们在法向空间或使用球坐标构造体素网格。使用球坐标允许在二维 ( φ , θ ) (φ, θ) (φθ)空间中进行聚类,但需要在合并聚类的后续处理步骤中使用更大的邻域。

对于法线空间的聚类,我们计算一个三维体素网格,并将局部表面法线映射到相应的网格单元 w . r . t w.r.t w.r.t.的大小。表面法线落入同一网格的点,形成具有相同法线方向的初始簇和平面集合。要么所有非空单元格,要么只有那些具有最小点数的单元格被认为是初始簇。
为了补偿相关的离散化效应,我们在三维网格结构中检查网格的邻居。如果两个相邻网格单元的平均表面法线方向低于聚类大小(和所需的精度),则合并相应的聚类。
为了能够合并多个集群,我们跟踪所进行的合并。如果集群a应该与集群b合并,且集群b已经与集群c合并,我们检查是否可以合并a和c,或者a + b是否比a + c是更好的合并。

2.2、Segmentation refinement in distance space

  1. 在假设集群中所有点都在同一平面上的前提下,我们使用相应的平均归一化曲面法线,计算原点到平面的距离
  2. 自然地,这些距离对于不同平行平面上的点是不同的,我们可以在距离空间中拆分集群
  3. 为了补偿距离传感器越远的测量值受不同误差和噪声源的影响越强的事实,我们计算了一个对数直方图。
  4. 同样地,那些距离落入同一个bin的点形成初始簇。然后通过检查邻近的bin来细化这些簇,就像在法线分割的细化中一样。
    如图3所示

在这里插入图片描述

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Deep Snake是一种用于实时实例分割的算法。它基于深度学习技术,通过对图像中的每个像素进行分类,实现对目标物体的精确分割。Deep Snake算法具有高效性和准确性,可以应用于许多领域,如自动驾驶、医学影像分析等。 ### 回答2: DeepSnake是一个用于实时实例分割的新型神经网络模型。与传统的基于卷积神经网络(CNN)的实例分割方法不同,DeepSnake使用自适应的密集曲线组件,来更好地关注目标对象的形状特征,从而实现更精确的分割结果。 DeepSnake的设计基于一种称为“变形回归”的曲线回归方法。该方法使用两个CNN分支,来分别处理图像区域和曲线参数,然后将它们组合起来进行端到端的训练。其中,图像分支出自用于目标检测任务的ResNet,而曲线分支则采用了U-Net结构。 DeepSnake的优点在于可以克服目标形状多样性和大小变化等问题,能够适应各种不同的数据集,并且在计算效率上具有很高的实时性。与一些竞争的实例分割算法相比,DeepSnake在准确率和速度上都有不错的表现。在PASCAL VOC 2012和COCO 2017数据集上测试,DeepSnake的性能超过了相同条件下的大多数算法,同时具有更低的计算成本。 总之,DeepSnake为实时实例分割任务提供了一种创新的方法,可以应用于许多领域,如智能监控、自动驾驶和机器人导航等。 ### 回答3: Deep Snake是一种用于实时实例分割的新型神经网络架构,由来自华盛顿大学的研究团队开发。与目前主流的神经网络架构Mask R-CNN相比,Deep Snake的优势在于能够更加准确地分割物体,同时在速度和计算资源消耗方面表现更好。 具体来说,Deep Snake使用了一种名为“蛇形控制器”的新型机制来协调具有各自目标的多个神经元。这种机制使得网络在提取图像中物体的轮廓信息时更加准确。Deep Snake还采用了特殊的分组卷积层,用于在不同的尺度上提取特征,以更好地分割物体。 此外,Deep Snake还可以使用相对较少的内存和计算资源,快速运行实例分割任务。研究者使用COCO数据集进行了实验,结果表明Deep Snake在准确率和速度方面都优于Mask R-CNN。在单个Nvidia 1080Ti GPU上,Deep Snake可以实现每秒5.7帧的实时实例分割,准确率高达33.6%。 总的来说,Deep Snake是一种非常有潜力的神经网络架构,可用于实时实例分割。它不仅可以提高准确性,还可以节省计算资源和实现更快的运行速度。未来,深度学习的研究者将继续探索和改进这种架构,以满足不断发展的实时实例分割需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值