离线一键图片转3D模型！6G显存，快速建模！

最新推荐文章于 2025-03-28 23:26:36 发布

嘟嘟实验室

最新推荐文章于 2025-03-28 23:26:36 发布

阅读量2.1k

点赞数 5

分类专栏： AI 文章标签：人工智能 python AIGC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43935971/article/details/136984611

版权

AI 专栏收录该内容

49 篇文章

订阅专栏

只需一张图片就可以一键生成3D模型！今天给大家分享一个好玩的项目——TripoSR。项目特点是非常快速的生成3D模型。整合包文章末尾自取。

推荐配置

Windows

win10以上系统 N卡 6G以上显存

Mac

M1/M2/M3系列芯片

如何使用

使用方法很简单，我们只需要选择一张正面视角的图片，拖拽到输入图像中，然后点击生成就可以得到3D模型啦。

注意

刚运行时会输出两个warning，这个是正常的。

cuda提示

Windows的用户在生成模型的时候如果电脑上没有安装cuda会提示以下信息。但是还是可以正常使用的。（torchmcubes未使用CUDA支持进行编译，改用CPU版本）cuda的安装包我也放在了网盘里。

移除背景

这个选项默认是打开的。开启后会将原始图像（左图）的主体与背景剥离出来，生成单主体的透明通道图像（右图）。建议此选项保持默认开启。

生成的模型格式有两种：第一种是OBJ格式，另一种是GLB模型。

我们可以将生成好的模型导入到3D建模软件中进一步处理，或者导入到Unity、UnrealEngine等游戏引擎中使用。这个如果你了解建模渲染相关的知识，你应该会很容易理解。

在建模软件中或游戏引擎中导入模型后，进一步优化效果包括灯光调整、贴图优化等操作，能够使模型表现更出色。下面是我导入到Unity中，还未打光的效果。

效果展示

以下是我在网上找的一些图片生成的3D效果。

技术解析

TripoSR利用Transformer架构，通过图像编码器将RGB图像转换为特征向量，利用图像到三面体解码器将这些特征映射到三维空间的三面体表示，然后使用基于三面体的神经辐射场（NeRF）生成3D对象的表面细节和纹理信息，从而实现快速且高质量的单图像3D重建。

模型设计基于Transformer：TripoSR的设计基于Transformer架构，特别适用于单图像3D重建任务。Transformer是一种强大的神经网络架构，擅长处理序列数据，如自然语言处理任务，但也可以应用于图像处理领域。
图像编码器：TripoSR包含一个图像编码器，该编码器使用预训练的视觉Transformer模型（如DINOv1）将RGB图像转换为一组潜在向量。这些向量编码了图像的全局和局部特征，为后续的3D对象重建提供了必要的信息。
图像到三面体解码器：TripoSR还包括一个图像到三面体解码器，用于将编码后的图像特征映射到三维空间中的三面体表示。这有助于将图像信息转换为3D对象的表示形式。
三面体神经辐射场（NeRF）：TripoSR的核心组件之一是基于三面体的神经辐射场（NeRF），用于生成3D对象的表面细节和纹理信息。NeRF是一种用于渲染复杂场景的神经网络模型，可以生成高质量的3D重建结果。

一些不足

我测试下来，当图片中的主体为侧视或者其他角度时，建模生成的模型会很奇怪。比如下面这个鸭子👇🏻。

整合包获取

👇🏻👇🏻什么？是不是收费的？👇🏻👇🏻

关注公众号,发送【TripoSR】关键字获取整合包。

如果本文对您有帮助，还请麻烦给文章点个免费的赞，感谢您的阅读。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。