点云的基本知识

还有你Y

已于 2024-04-13 09:34:29 修改

阅读量891

点赞数 16

分类专栏：全息通信文章标签：点云

于 2024-04-13 09:32:44 首次发布

本文链接：https://blog.csdn.net/qq_45889056/article/details/135296150

版权

全息通信专栏收录该内容

3 篇文章 0 订阅

订阅专栏

3D Mesh

3D Mesh（三维网格）通常是通过建模软件、扫描设备或计算机图形学算法生成的。以下是几种常见的方式：

手工建模： 设计师和艺术家可以使用专业的三维建模软件（例如Blender、Autodesk Maya、3ds Max等）手工创建三维模型。在这个过程中，他们可以添加顶点、边和面，调整形状，并为模型分配材质和纹理。
扫描： 通过使用3D扫描仪，物体的表面可以被捕捉为一系列点云数据。这些点云数据然后可以被转化为三维网格。扫描可以应用于真实世界中的物体，包括雕塑、建筑物、人体等。
体素化： 通过将空间分割成均匀的立方体网格（体素网格），然后根据某些规则或算法将每个立方体的表面进行提取，得到一个表面网格。这个过程可以应用于一些基于体素的建模方法，如基于体素的形状表示。
物理引擎生成： 在计算机图形学和游戏开发中，物理引擎通常用于模拟物体的行为和外观。这些引擎通常会生成三维网格来表示模拟的对象。
程序生成： 利用计算机图形学算法，可以编写程序来生成三维网格。这可能包括分形算法、参数化建模、曲线曲面生成等方法。
深度学习： 最近，深度学习技术也在三维网格生成方面取得了一些进展。通过使用生成对抗网络（GANs）等技术，可以从大量的三维数据中学习并生成具有逼真外观的三维网格。

不同的方法适用于不同的应用和场景。手工建模常用于艺术创作，扫描用于捕捉真实世界中的对象，而算法生成通常用于程序化的建模需求。选择哪种方法通常取决于项目的特定需求和资源可用性。

体素化

对点云进行体素化是将连续的三维点云数据转化为离散的三维体素网格的过程。体素（Voxel）是三维体积中的立方体单元，类似于图像中的像素。体素化通过在空间中划分网格，并将点云数据映射到离散的体素中，使得点云的形状和结构能够更方便地进行分析、处理和存储。

具体来说，体素化涉及以下步骤：

空间划分： 将三维空间划分为均匀的立方体，形成一个三维的体素网格。每个体素代表一个离散的三维区域。
点云映射： 将点云中的每个点映射到最近的体素中。这通常涉及到计算点云中的点到体素中心的距离，并将点分配给最近的体素。
属性存储： 在体素中存储与该区域相关的信息，如点的数量、平均法线、颜色等。这可以通过对每个体素进行统计来实现。

体素化的优势和应用包括：

简化表示： 通过体素化，点云的连续数据被转化为离散的、规则的体素网格，从而简化了数据的表示和处理。
体积分析： 体素化使得容易进行体积分析，例如计算物体的体积、质心等。
图像处理技术： 体素网格可以应用于图像处理技术，例如体绘制、体剖析等。
计算机图形学和计算机辅助设计（CAD）： 体素化常用于表示和处理三维模型，为计算机图形学和CAD领域提供了有效的工具。
深度学习： 在深度学习中，体素化也被用于将点云数据转化为可以输入神经网络的形式，以进行三维物体识别和分割等任务。

总体而言，体素化为处理和分析三维点云数据提供了一种有效的手段，使得这些数据更易于处理和理解。

体素化与体渲染

三维重建是指从二维图像或其他数据源中恢复出三维场景或物体的形状、纹理、颜色等信息的过程。三维重建的一个重要步骤是体素化，即将三维空间划分为许多小的立方体（体素），并为每个体素赋予一定的属性，如颜色、透明度、法向量等。体素化可以有效地表示复杂的三维结构，如人体器官、植物、云雾等。
体渲染是指将体素化后的三维数据转换为可以在屏幕上显示的二维图像的过程。体渲染的一个主要挑战是如何处理体素之间的遮挡关系，即决定哪些体素对最终的图像有贡献，哪些体素被其他体素遮挡而不可见。体渲染的常用方法有基于射线的方法和基于投影的方法。基于射线的方法是从视点发出一条条射线，沿着射线采样体素的属性，并根据一定的混合模型计算最终的像素值。基于投影的方法是将体素按照一定的顺序投影到屏幕上，并根据一定的混合模式更新屏幕缓冲区的像素值。

挑战

1.挑战

（1）点云具有稀疏性

不同于图像，三维点云在表示物体时，只有物体表面有点云数据，如果是在实际的场景下，往往只有面向雷达的一面才会有数据产生。而且限于雷达的工作原理，远处物体的点云数据更加稀疏。因而，在点云上直接进行三维卷积需要很大的计算量，而其中很大一部分资源都是在处理空数据。

（2）点云具有无序性

三维空间中的点云不会像图像那样，规规矩矩的在一个个的像素点排好队，点云并没有顺序，这给处理上带来极大的困难。一个物体如果使用N个点云表示，那么它的排列方式具有N!种，但是表示的却是同一个物体，这是不可想象的处理难度。因而，点云的处理需要实现置换不变性。

（3）点云具有几何变换问题

一个物体在图像上的显示并不会随着物体位置的改变而发生大的变化。但是点云反应的却是实实在在的位置坐标信息，不同位置处的同一物体所表现出的数据特征是很大不同的。

2.常用方法

（1）多视角+2D卷积

这是较早使用的方法，将三维点云数据，通过多个视角的投影，转换成2D，进而转到图像方法上进行处理。该方法避开了处理三维点云数据，但是多视角投影的方法增加了计算量、损失了点云的三维空间信息。

（2）体素化+3D卷积（voxel_base）

voxel_base的方法就是先将原始点云进行体素化处理，将无序的点云转为有序，并进而使用3D卷积进行处理。而且为了解决点云稀疏性带来的卷积计算量大问题，也提出了稀疏卷积的方法，舍弃那些空白体素，加快执行速度。VoxelNet

（3）原始点云+MLP（point_base）

point_base是除了voxel_base之外另外一种优雅的处理方式，最开始是在2017年的CVPR论文PointNet提出。point_base不经过体素化过程，直接对原始数据进行处理，通过多层的mlp进行点云特征的描述，经过max pooling保证了点云的置换不变性。处理的方式很简单，效果确实很不错，并且已经成为三维点云处理中的一个重要理论和思想基础。PointNet

NeRF

NERF，全称为Neural Radiance Fields，是一种基于神经网络的三维场景表示方法。它被设计用来重建和渲染三维场景，尤其在计算机图形学和计算机视觉领域引起了广泛关注。NERF是由Ben Mildenhall等人于2020年提出的。

NERF的核心思想是使用深度神经网络来建模场景中的辐射场。通常，在三维场景中，辐射场描述了从场景到相机的每个方向上的光线强度。NERF的网络结构通过学习从场景中的位置和方向到光线强度的映射，从而能够生成高质量的图像，包括真实感的光照和阴影效果。

NERF的主要组成部分和特点包括：

Neural Radiance Fields（神经辐射场）： NERF使用一个神经网络来表示整个场景中每个点的辐射场。这个神经网络可以接受场景中的坐标和方向作为输入，输出相应点的颜色和透明度。
Volume Rendering（体素渲染）： NERF通过对神经辐射场进行体素渲染，即在场景中的每个体素（三维像素）上评估辐射场。这使得NERF能够以可微分的方式生成图像，从而可以用于训练端到端的神经网络。
View Synthesis（视图合成）： NERF的一个重要应用是视图合成，即生成从不同角度观察场景的图像。通过训练网络，NERF可以合成出具有逼真外观的新视图，包括光照和阴影等效果。
点云输入支持： 在原始的NERF中，场景被表示为连续的辐射场。后来的工作如NeRF-W（NeRF in the Wild）扩展了NERF以支持离散的点云输入，使其更适用于真实世界的复杂场景。

NERF在许多方面都具有优势，如其能够生成高质量的图像，对场景的建模能力较强。然而，由于计算代价较高，NERF在实时应用上的局限性也引起了关注。后续工作也出现了一些改进和扩展，以进一步提高NERF的性能和适用性。、

压缩感知

在压缩感知（Compressive Sensing，CS）的语境下，虽然它主要涉及信号的稀疏表示和欠采样恢复，但同样可以借用图像处理中的频域概念来理解图像的高频信息。

图像的高频信息通常指的是图像中灰度值或颜色快速变化的部分。在频域分析中，通过傅里叶变换或其他变换（如离散余弦变换、小波变换等），图像被转换到频率域，其中低频分量对应缓慢变化的区域（比如图像的背景或大面积同色区域），而高频分量则对应着细节丰富、边缘明显或者色彩对比强烈的区域。

在压缩感知应用中，如果图像数据在某种变换域下是稀疏的，那么其高频部分往往代表了那些非冗余、对图像内容贡献显著的信息。例如，在进行图像压缩时，高频部分可能包含更多的有效视觉信息，如纹理、边缘和细节，这些信息对于保持图像质量至关重要，但也更难以压缩和重建。

利用压缩感知技术，通过设计合适的测量矩阵并对图像进行欠采样，理论上可以仅凭借少量随机投影的数据就足以恢复原始图像，尤其是当图像的高频部分具有稀疏性特征时。然而，实际应用中，高频信息的恢复通常更为困难，需要更复杂的算法保证恢复的质量和精度。

还有你Y

关注

16
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
点云的基本知识

不同于图像，三维点云在表示物体时，只有物体表面有点云数据，如果是在实际的场景下，往往只有面向雷达的一面才会有数据产生。三维空间中的点云不会像图像那样，规规矩矩的在一个个的像素点排好队，点云并没有顺序，这给处理上带来极大的困难。对点云进行体素化是将连续的三维点云数据转化为离散的三维体素网格的过程。NERF的网络结构通过学习从场景中的位置和方向到光线强度的映射，从而能够生成高质量的图像，包括真实感的光照和阴影效果。但是点云反应的却是实实在在的位置坐标信息，不同位置处的同一物体所表现出的数据特征是很大不同的。
复制链接

扫一扫