读论文《Hi3D: Pursuing High-Resolution Image-to-3D Generation with Video Diffusion Models》

论文地址:2409.07452v1 (arxiv.org)

项目地址:GitHub - yanghb22-fdu/Hi3D-Official: [MM24] Official codes and datasets for ACM MM24 paper "Hi3D: Pursuing High-Resolution Image-to-3D Generation with Video Diffusion Models".

尽管图像到3D生成领域取得了巨大进展,现有方法在生成具有高分辨率纹理细节的多视角一致图像方面仍然存在挑战,尤其是在缺乏3D感知的2D扩散模型范式中。本文提出了一种名为Hi3D的高分辨率图像到3D生成框架,该框架首先从输入图像生成多视角一致的图像,然后从这些生成的图像重建高保真的3D网格。Hi3D通过利用预训练的视频扩散模型,将单图像到多视角图像的转换重新定义为3D感知的序列图像生成(即轨道视频生成)。这种方法深入挖掘了视频扩散模型中的时间一致性知识,这些知识可以很好地推广到3D生成中的几何一致性。技术上,Hi3D首先赋予预训练的视频扩散模型3D感知先验(相机姿态条件),产生具有低分辨率纹理细节的多视角图像。接着,学习一个3D感知的视频到视频细化器,进一步提高多视角图像的分辨率和纹理细节。这些高分辨率的多视角图像通过3D高斯散射进一步增强,最终通过3D重建获得高保真网格。广泛的实验表明,Hi3D在新颖视图合成和单视图重建任务上都取得了优越的性能。

这是第一个高分辨率 (1,024×1,024) 图像到 3D 生成框架。Hi3D 首先从输入图像生成多视图一致的图像,然后从这些生成的图像中重建高保真 3D 网格。

模型方法

Hi3D模型采用了两阶段的方法来实现高分辨率的图像到3D生成。

在基础多视角生成的第一阶段,Hi3D重塑了视频扩散模型在附加相机姿势条件下,将单视角图像转化为低分辨率的3D感知顺序图像,接下来,在3D感知多视角细化的第二阶段,我们反馈了这个低分辨率轨道视频进入 3D 感知视频到视频精炼器,具有额外的深度条件,导致高分辨率轨道视频具有高度细节的纹理。最后,通过3D澳大利亚站和基于SDF的重建,增强多视图图像的新颖性,提取出高质量的三维网格。
第一阶段:基础多视角生成
  • 目标:将单视图图像转换成低分辨率的3D感知序列图像(轨道视频)。
  • 方法:使用预训练的视频扩散模型,通过额外的相机姿态条件进行微调,以生成多视角一致的序列图像。
  • 数据集:使用从Objaverse数据集的LVIS子集中渲染的高分辨率多视角图像数据集进行训练。
  • 训练细节:输入图像通过VAE编码器投影到潜在空间,并与噪声潜在序列进行通道级联接,以鼓励合成的多视角图像保留输入图像的身份和细节。
第二阶段:3D感知多视角细化
  • 目标:将第一阶段生成的低分辨率多视角图像进一步细化为具有高分辨率纹理细节的图像。
  • 方法:设计一个新的3D感知视频到视频细化器,利用深度信息进一步提升图像的分辨率和细节。
  • 训练细节:采用VAE编码器提取预生成多视角图像的潜在代码序列,并与噪声潜在代码进行通道级联接。同时,利用现成的深度估计模型来估计生成的多视角图像的深度,作为3D线索。
3D网格提取
  • 目标:从生成的高分辨率多视角图像中提取高质量的3D网格。
  • 方法:首先使用3D高斯散射(3DGS)算法从生成的高分辨率图像序列中学习隐式3D模型,然后通过基于SDF的重建方法提取3D网格。
  • 细节:通过3DGS渲染额外的插值视图,并优化SDF重建方法,从增强的密集视图中提取高质量的3D网格。

实验

  • 数据集:使用Google Scanned Objects (GSO) 数据集进行定量评估。
  • 指标:采用PSNR、SSIM和LPIPS等指标进行新颖视图合成任务的评估;采用Chamfer Distances和Volume IoU评估单视图重建任务的质量。
  • 比较方法:与RealFusion、Zero123、SyncDreamer、EpiDiff等最新方法进行比较。
  • 与 Stable-Zero123[52]、SyncDreamer[27] 和 EpiDiff[21] 在新颖视图合成问题上的定性比较。OurHi3D 生成高分辨率多视图图像,具有非凡的一致细节。
在单视图重建任务中由各种方法生成的 3D 网格的定性比较。

 

结论

Hi3D通过利用预训练视频扩散模型中的3D先验知识,有效地提高了图像到3D生成的质量。该方法通过两阶段的视频扩散模型范式,实现了高分辨率图像到3D的生成,具有创新性和实用性。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

请站在我身后

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值