RPM-Net: Recurrent Prediction of Motion and Parts from Point Cloud

最新推荐文章于 2021-12-14 22:49:14 发布

莫问前程学无止境

最新推荐文章于 2021-12-14 22:49:14 发布

阅读量399

点赞数

分类专栏：论文阅读文章标签： python 深度学习机器学习 3d

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_40582876/article/details/109675547

版权

论文阅读专栏收录该内容

26 篇文章 0 订阅

订阅专栏

RPM-Net的文章发表在2019年的Trans on Graphics 上面，同时收录在siggraph asia 2019上面.

作者提出的问题：当给出很少的静态物体的时候如何去预测part的运动。因此本文主要解决的就是给定少量的物体，或者

物体的一部分，可以预测出它们的变化。

以这把伞为例子，给定这么一个模型，使用PRM-NET网络可以做出它的一系列动态变化的过程：

上图展示了一把雨伞收起来的动态过程，是通过PRM-NET这个网络来完成的。所以这个网络的创新点在于，首先可以预测出一个模型的正常的运动的过程，其次，可以对物体进行一个正确的分割。这个网络的输入的点的数量是2048个点。

主要的contribution:

(1) 引入了一个loss函数，这个loss函数由一个重建Loss加上一个motion的loss来组成。

(2)使用RNN网络的时候，使得我们不但可以预测运动的后续帧，还可以决定什么时候停止。

方法

解决这些问题的方法主要是用两个网络autoencoder+LSTM的方法来预测变化。

数据集的制作：对数据集中的数据进行在同一个方向上的分割，分割称为part，对其中的每个part进行标注，每一个shape都有一个reference part和一个或者多个moving parts。对于数据集中的每个shape，我们采用将moving part和 reference part组合成联合的pair，称之为mobility unit，并将ground-truth的mobility unit与其相关联，指定其为描述物体移动性的一组参数，并用来描述reference part和moving part之间的移动。

参数由一个四元组来表示，其中 $\tau$ 表示的是移动变换的类型(例如平移变换，旋转变换等)，d和x分别表示的是方向和旋转轴，r表示的是变换的范围例如起始位置和结束的位置，或者选择的角度。

本篇论文的一个最大的创新点是可以进行一些non-trivial的变换。

上图是本篇论文的pipeline，给定输入的点云 $P_{_{0}}$ ，网络的映射，以及分割的结果 $S$ ，它们共同提供最终的运动序列。

说说这篇论文中对我的帮助：

这篇论文是需要对3D模型做运动序列的预测，整体的idea非常的好，使用的方法需要对数据集做很多的标注工作（其实我在做工作的时候，一直想的是能不能用尽可能少的数据集预处理工作，而将这个过程用算法来替代，这样是不是在后续具体的算法落地的实验过程中更友好一些，但是目前看来，学术界对数据集的各种预处理真实炉火纯青，只有你想不到，我还需要多多学习），最后，作者的网络结果有很大的创新性，这种网络结构的拼接，是不是在训练实现上显得更加困难呢？

莫问前程学无止境

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RPM-Net: Recurrent Prediction of Motion and Parts from Point Cloud

RPM-Net的文章发表在2019年的Trans on Graphics 上面，同时收录在siggraph asia 2019上面.作者提出的问题：当给出很少的静态物体的时候如何去预测part的运动。因此本文主要解决的就是给定少量的物体，或者物体的一部分，可以预测出它们的变化。以...
复制链接

扫一扫

专栏目录

莫问前程学无止境 CSDN认证博客专家 CSDN认证企业博客

码龄7年

43: 原创

41万+: 周排名

197万+: 总排名

6万+: 访问

: 等级

599: 积分

14: 粉丝

33: 获赞

20: 评论

120: 收藏

私信

关注

分类专栏

笔记 14篇
论文阅读 26篇

最新评论

Learning Deformable Kernels in 3D GraphConvolution Networks for Point Cloud Analysis 阅读笔记
兰宵宫: w(k)=1应该是4.2节上面那一段写的，意思是将卷积核的权重初始化为1，之后通过学习更新，你的理解应该是对的。使用L个Kernel（卷积核）的原因其实和二维图片卷积过程中使用多个filter（卷积核）的原因一样，二维图片卷积运算过程中，每个filter生成一个通道，有几个filter卷积生成的特征图就有几个通道。在这篇论文里面，有L个kernel，卷积更新后的点的特征向量的长度久为L。
GAN 网络训练中，G_loss上升，D_loss下降
qq_55505508: 请问你是咋解决的啊！我目前也是G的损失上升，D的损失下降到0，并且生成的数据基本都一样
GAN 网络训练中，G_loss上升，D_loss下降
qq_41806782: 博主,如何理解最后一段discriminator对输入导数为0, generator训练会完全停止
GAN 网络训练中，G_loss上升，D_loss下降
越过小山丘: 我感觉应该是二者都震荡，整体都没有明显下降，表示G和D没有哪一方更强，其他设计的loss会下降。（如果理解有误还请指出）
GAN 网络训练中，G_loss上升，D_loss下降
雨季狂热: 是不是应该都降低，然后达到平衡呢，因为他是按照梯度下降计算的，

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。