新视角生成(Novel View Synthesis)是计算机视觉与图形学领域的核心技术,旨在从单张或稀疏图像中生成任意视角的高保真图像,突破传统多视角数据的限制,实现对三维场景的自由探索。作为计算机视觉与图形学的交叉领域,近新视角生成年来在算法创新、应用落地和工具生态上均取得显著进展。以下是基于2023-2025年最新研究成果的综合分析:
一、核心技术突破
1. 扩散模型与3D先验的融合
- ViVid-1-to-3(CVPR 2024):通过视频扩散模型生成扫描视频,将单张图像转化为多视角序列,解决了传统方法在姿态一致性和细节保真度上的瓶颈。该方法在Nerf数据集上实现了LPIPS指标提升28%,并支持6自由度相机控制。
- ViewCrafter(北大&港中文&腾讯,2025):结合点云先验与扩散模型,从单张或稀疏图像生成可控视角视频。其迭代视图合成策略通过逐步扩展点云覆盖范围,在Tanks-and-Temples等真实数据集上实现了