腾讯混元3D开源模型又添新成员。
6月14日,在计算机视觉领域国际顶级会议CVPR 2025上,腾讯混元3D 2.1大模型正式对外开源,这也是首个全链路开源的工业级3D生成大模型。
相较于广受社区欢迎的混元3D 2.0,2.1模型优化了几何生成的质量,同时开放了PBR(基于物理的渲染)材质生成大模型,进一步提升3D资产的质感和光影表现,将AI 3D开源模型的可用性推进至全链路可用阶段。
腾讯混元3D模型负责人郭春超表示,混元3D 2.1的全面开源是一个新起点,期待与全球开发者、创作者及研究者携手,共同打造更加繁荣的3D开源生态。
几何与纹理双优化,PBR技术提升真实感
如果说几何是3D模型的“骨骼”,定义了模型的形态、轮廓与细节精度;纹理则是3D模型的“皮肤”,还原模型表面的颜色、光泽和细节表现。
在混元3D 2.0的基础上,混元3D 2.1模型进一步强化了“几何-纹理解耦”架构。
基于DiT几何架构,混元3D 2.1优化了细节建模,使网格精度更高,具备更好的形状一致性,为后续纹理映射提供了坚实的基础。同时,混元率先在3D开源模型中引入PBR纹理生成技术。基于多视图生成、逆渲染和贴图技术,混元3D 2.1 可生成基础颜色、金属度、粗糙度等贴图,支持皮革、木质、金属、陶瓷等多种复杂材质的高质量渲染。
相较传统RGB 贴图技术,PBR通过模拟光线与材质的物理交互,提升模型在不同光照环境下的视觉一致性。在用户盲测中,混元3D 2.1的PBR纹理相较于RGB贴图,质感胜出率高达78%。
这种物理真实性不仅满足电影、游戏等高要求渲染场景的需求,也为工业设计、虚拟仿真和数字孪生提供了可靠3D资产。此外,PBR材质的标准化特性使其兼容主流渲染引擎(如Unreal Engine、Unity),提高了3D资产在跨平台、跨行业的复用性,推动3D模型从消费级创作向工业级应用的转型。
全链路开源,降低开发门槛
混元3D 2.1大模型在效果全面升级的基础上,提供了模型权重、训练代码和数据处理流程的全链路开源,开发者可以自由微调、二次训练或优化,满足定制化需求,同时为学术研究提供平台。
在部署方面,混元3D 2.1适配于消费级显卡,在Github 等开源地址提供了详细部署和使用教程,企业、中小团队及个人开发者都能轻松上手。
据悉,腾讯游戏自研编辑器轻游梦工坊已应用混元 3D在多条美术管线完成提效,道具管线制作周期由2天/个降低至0.2天/个,相信模型开源有望加速3D内容创作的普及。
持续突破,助力开源生态繁荣
腾讯混元3D致力于通过AIGC技术重塑3D制作管线,致力于解决传统3D建模耗时、成本高、数据稀缺等行业痛点。
自2024年11月发布并开源首代3D生成模型以来,腾讯混元持续迭代创新。2025年1月,混元3D 2.0在文本一致性与几何精度上超越主流模型;3月,一次性开源5款3D生成模型,实现秒级资产生成;4月,混元3D 2.5模型精度提升超10倍,迈入超高清时代。
此前,腾讯还发布了面向创作者的3D AI创作引擎。该引擎支持文生、图生以及多视图输入功能,同时具备智能拓扑能力——通过自回归技术生成拓扑结构接近手工布线的低模, 并整合了多套适配3D设计师需求的专业工作流,涵盖角色/道具设计等场景,可充分满足游戏开发、动画影视及3D打印等领域的专业需求。
腾讯混元坚定拥抱开源,旗下图像、视频、3D、文本等多种模态基础模型已全面开源。作为最受欢迎的 3D 开源模型之一,混元3D模型在Hugging Face平台下载量已超过180万,广受全球开发者认可。
开源主页:
https://3d-models.hunyuan.tencent.com/
Model:
https://huggingface.co/tencent/Hunyuan3D-2.1
Demo:
https://huggingface.co/spaces/tencent/Hunyuan3D-2.1
代码(Github):
https://github.com/Tencent-Hunyuan/Hunyuan3D-2.1
混元3D AI创作引擎:
https://3d.hunyuan.tencent.com/