VFE------多层的体素特征编码(Stacked Voxel Feature Encoding)
现在很多三维点云处理的网络中都会利用VFE结构来进行点云的特征处理。比如说VoxelNet:
下面简单说一下VFE的流程:
1. 将体素内所有点取平均值得到(Vx,Vy,Vz)。
2. 将每个点的特征升维变成7维的特征点,即Vin。
3. 首先将带有7个特征的每个点Pi输入到FC网络(FC+BN+ReLU)得到Point-wise feature,得到m维特征的点,即7 -> m.
4. 然后经过Maxpoling对上一步得到的特征进行逐元素的聚合得到局部聚合特征(Local Affregated Feature)
5. 拼接point-wise feature和Locally Aggregated Feature 得到融合(单个+局部)的Point-wise concatenated feature
6. 对最后的Point-wise Feature 最大池化得到Voxel-wise Feature(长度C)
7. 对所有的非空的提速格我们都进行上述操作,共享全连接层(FC)的参数
额,其实就是将两个PointNet叠加在了一起。
最后再贴一张图。