SE3-Nets Learning Rigid Body Motion using Deep Neural Networks(1)
- 输入:三维点;系统输入(如推力);
- 输出:三维点
该论文只针对三维点云输入(RGBD等),来求解每帧中目标物体的刚体变换关系(SE(3), pose)。
在这些深度学习框架的位姿估计问题中,旋转都使用旋转向量(3维度)的方式。
以及需要分割的个数(?提前知道个数,最大个数吧?),得到各个分割块的pose(随后可以根据pose将点云转换过去)
SE3-NETS learn to segment effected object parts and predict their motion resulting from the applied force.
作者认为之前的物理模型(非深度模型)虽好,但依赖的是精准的观测量和基于此的精准的预测,而人是靠直觉、模糊的预测来行动的。而之前的基于物理
1.流程和网络架构
如图:
作者的网络分为两个部分:
1.Encoder部分输入点云,同时用一个全连接网络来接收控制输入,结果
2.在Encoder之后,Decoder部分做了两件事:
- 将区域按照目标分类,识别出那些一同运动的像素部分(称之为一个目