CAPNet是一个点云重建网络,利用点云的投影图像和真实图像之间的误差来训练。结构如下:
主要还是一个encoder和一个decoder。M是通过投影操作将点云投影到相机视角下的图片上后的图像,用图像之间的误差来进行训练。其中投影有高斯平滑操作,如下:
其中x_n,y_n是(i,j)所有附近区域的投影点,然后通过高斯扩展影响到(i,j)得到图像上(i,j)点的颜色值大小M。
loss为:
也就是投影图像和真实图像误差,但是仅仅这一项不够,重建会有大的误差,需要有最近邻亲和loss加上才行: