【点云阅读笔记】LEARNING CONVOLUTIONAL TRANSFORMS FOR LOSSY POINT CLOUD GEOMETRY COMPRESSION

Jonathan_Paul 10

已于 2022-03-17 21:41:19 修改

阅读量5.2k

点赞数 1

分类专栏：点云阅读笔记文章标签：人工智能计算机视觉

于 2022-03-15 13:04:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43444175/article/details/123500056

版权

点云阅读笔记专栏收录该内容

10 篇文章 10 订阅

订阅专栏

阅读报告——LEARNING CONVOLUTIONAL TRANSFORMS FOR LOSSY POINT CLOUD GEOMETRY COMPRESSION

Worth noticing in Introduction

质量评价衡量：

D1 and D2

D1：计算重建点和K近邻之间的MSE

D2：计算重建点和超平面之间的MSE

Main Idea

对于基于传统八叉树模型的方法，它在降低比特流时，其点的数量会指数下降；
通过将点云几何体解释为在体素网格上定义的二进制信号，我们将解码转换为对给定体素是否被占用进行分类的问题。
使用3D自动编码器压缩点云几何体：经典的压缩方法使用手工制作的变换，但我们直接从数据中学习过滤器。
综合考虑了在训练中的量化（Quantization）和率失真（Rate-distortion，RD）

创新点

将图像压缩中的二维卷积换成了适合点云的三维卷积
将原始点云转换成体素网格（尺寸为长x宽x高的数组，值为0或1，分别代表该座标上是否存在点），即将问题转化成一个二分类的问题

模型

请添加图片描述

$f_a$ := 找寻潜在的表示 $y=f_a(x)$ 。

$Q$ := 量化函数。

$f_s$ := 解压缩表示 $\hat{x}=\hat{v}_{S}=f_{s}(\hat{y})$ 。

传统的编码过程需要经过几何编码——几何量化——几何熵编码的三个过程。在此，这里的 $f_a$ 充当了编码角色。但是与传统的几何编码不同，传统几何编码是通过一些变换（如DCT变换，将数据从时空域转到频率域上来）；这里的是用卷积进行变换。

原文中这里所使用的量化处理同Variational Image Compression With A Scale Hyperprior所使用的一致。这里的量化idea并非直接处理原始数据，而是量化其潜在表示。也就是这里的 $y$ 。这里使用的是Deflate算法。

在解码过程中，作者将其视为一个二分类问题：即对于每一个在体素网格上的点 $z\in \Omega$ ，观察其是否存在。做法是将 $\hat{x}=\hat{v}_{S}$ 分解到各自的体素 $z$ 中，对应有一个关联值 $p_z$ 。 $p_z$ 反映了与ground truth即类别 $y$ 的接近程度，值越大，则说明越接近类别 $y$ ，即分类越准确。

而且，因为点云是稀疏的（无论有多dense），因此，对于一个点在不在某一个体素上的问题， $v_s(z)$ 一般都是0。用 $\alpha_x$ 来补偿。因此，定义focal loss如下：

$L\left(p_{z}^{t}\right)=-\alpha_{z}\left(1-p_{z}^{t}\right)^{\gamma} \log \left(p_{z}^{t}\right)$

其中，

$p_{z}^t=\left\{\begin{array}{lr}p_z & \text { if } y=1 \\1-p_z & \text { otherwise }\end{array}\right.$

$L(\tilde{x})=\sum_{z \in S} F L\left(p_{z}^{t}\right)$

最终的损失是利用 $L=\lambda D + R$ ； $D$ 是用上面的focal loss计算的失真，R是bpov(bits per input occupied voxel)。

Jonathan_Paul 10

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。