对于一个三维物体,它本身存在在那里,人眼的观察从传统上被建模为相机外参+内参,也就是一个降维的矩阵变换。
适合计算机表示的三维模型有Voxel Occlusion,ESDF,TSDF等等,但对于人类大脑,显然不会通过矩阵建模,从三维世界获取二维图像。随着神经网络的流行,学界开始探索隐式的三维表示方法。
论文信息
NeRF:Representing Scenes as Neural Radiance Fields for View Synthesis (ECCV2020 Best Paper)
Neural RGB-D Surface Reconstruction(arxiv 2021)
传统渲染方法
所谓渲染,就是利用已经建立好的三维模型,重构出物体的表面点,再根据相机投影关系,生成任意视角的2D图像,也就是模拟人眼对物体的观察过程。
Ray Casting
用于Occlusion(透明度)和TSDF表示,从相机光心沿像素发出光线,这条光线穿过所有的对应三维模型的表示,寻找找表面过零点。
Marching Cube
对于正方体Voxel的Occlusion或TSDF表示,找0等值面。对应小正方体的格点视作Voxel的中心(有一个Occlu