【计算机视觉】简述对SCF-Net的理解

自2017年PointNet发布以来,它解决了直接以点云为输入的问题,因为点云是一种非常重要的三维数据,但是点云具有稀疏性和不规则性,所以很多研究者是研究的体素或图集为输入,PointNet的缺点就是他没有提取邻域的特征,也就是没有学习点与点的相对位置信息。所以它分割的效果不好,近两年的订刊文章(CVPR)发布了很多大场景点云分割的文章,像点卷积的文章他们采样的方法基本都是FPS+Ball quray的搜索方式,时间比较慢,大场景点云分割还得用RS采样的方法,像RandLA-Net(LocSE+Attentive Pool)、DLA-Net(Position encoding block+Self-Attention+Attentive Pool)都是使用的这种方法。总结来说现在很多算法都是去学习邻域的特征结合PointNet去提取特征。下面给大家介绍一下SCF-Net这篇文章,它分为三部分,局部极坐标表示(LPR)、双距离注意池(DDAP)和全局上下文特征块(GCF)。
对于局部极坐标表示模块,因为某一个场景某一类的不同东西的方向可能是不一样的,输入点对于学习特征的方向是非常敏感的,LPR学习的是极坐标系,特点就是对于Z坐标下旋转是有利的。首先将笛卡尔坐标转换为局部极坐标表示,先计算邻域内的质心,然后通过质心得偏移角,来更新点中心点和邻域点的变化,从而学习到局部极地表示和几何距离特征。
在这里插入图片描述在这里插入图片描述在这里插入图片描述
在这里插入图片描述
对于双距离池部分,它的输入是点云的特征、几何图案和几何距离(LPR学习得到的特征)。利用几何距离和和点特征进行拼接,然后与几何图案和点特征拼接起来的特征进行拼接,组成权重,进行softmax回归,应用于其空间特征中,进行加权求和聚合特征。后面有消融实验证明消除特征距离影响不大,但是消除双重距离影响很大。针对空间距离和几何距离拼接时的比例问题,消融实验证明直接拼接效果最好,对于特征距离学习的参数拉姆他选择不同,效果也会不同。
在这里插入图片描述 在这里插入图片描述 在这里插入图片描述 在这里插入图片描述
对于空间上下文模块,它利用位置和体积比ri来计算,通过点云坐标和这个比例作连接,该模块的具体作用我没有get到,不过据我和别人沟通,好像该模块起的作用并不是很大,它的消融实验也证明了。
在这里插入图片描述
对于SCF的结构而言,他们也是添加了扩展残差模块,目的是为了防止参数过拟合,优化。而且它的LPR+DDAP也扩展了一倍,与RandLA-Net类似,为了增加网络的感受野。对于SCF-Net的网路结构而言,它和RandLA-Net和DLA-Net很类似,都是RS+相应构造的结构,先聚合点的特征,提升网络的维度,降低点云的尺度,然后提取完特征之后,利用近邻插值进行上采样还原到初始点,完成分割任务。 在这里插入图片描述
其实这篇论文,我自己的见解是没有RandLA-Net好,因为感觉它的复杂性比RandLA-Net要高,但是他在Semantic3D数据集上的Miou比其只高了0.02,所以可能就是复杂性多了点,如果想详细了解,可以去论文里面体会一下,上述是自己的一个理解,如有不对,请多多指正!!!

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

面向发疯编程@Lyx

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值