本系列文章由@邻居张师傅 出品,转载请注明出处。
文章链接: https://blog.csdn.net/qq_39120048/article/details/117753592
邮箱: zhangyh.nb@qq.com
应该是深度学习压缩点云领域的开创性论文,研究该方向的同学可以好好研究一下,论文本身也并不难。
从图像的深度学习压缩上更改而来:
- 将图像压缩中的二维卷积换成了适合点云的三维卷积
- 将原始点云转换成体素网格(尺寸为 长x宽x高 的数组,值为0或1,分别代表该座标上是否存在点),即将问题转化成一个二分类的问题
其他部分和图像的深度学习类似。
图像的深度学习可以参考:
论文地址
论文地址:https://arxiv.org/abs/1903.08548
Github地址:https://github.com/mauriceqch/pcc_geo_cnn
mesh_to_pc.py
将点云数据集转化为体素网格
体素网格的坐标是0和目标分辨率之间的整数坐标
结果如下,只选取了点云的前五个坐标,分辨率vg_size取64:
归一化后会导致多个坐标点相同,可去除
train.py
训练模型
自编码器网络
编码器analysis_transform
三层三维卷积层3D,形状依次是:
其中输入为(batch, channels, depth, height, width)
Conv3D参考: https://tensorflow.google.cn/api_docs/python/tf/compat/v1/layers/conv3d?hl=en
解码器synthesis_transform
解码器的网络与编码器对应,此处为转置的3D卷积