3D-GPT: 采用大语言模型的程序化3D建模-CSDN博客

本文链接：https://blog.csdn.net/yorkhunter/article/details/139693105

23年10月来自澳大利亚国立、牛津大学和北京智源的论文“3D-GPT: Procedural 3d Modeling With Large Language Models“。

在追求高效的自动化内容创建的过程中，程序化生成、利用可修改参数和基于规则的系统，是一种很有前途的方法。为了减少工作量，作者引入3D-GPT，一个利用大语言模型（LLM）进行指令驱动的3D建模框架。3D-GPT将LLM定位为熟练的问题解决者，将程序化3D建模任务分解为可理解的部分，并为每个任务指定合适的智体。

3D-GPT集成了三个核心智体：任务调度、概念化和建模智体。三者合作实现了两个目标。首先，它增强了简洁的初始场景描述，将其演变为详细的形式，同时根据后续指示对文本进行动态调整。其次，它集成了程序化生成，从丰富的文本中提取参数值，从而与用于资产创建的3D软件无缝对接。实证研究证实，3D-GPT不仅解释和执行指令，提供可靠的结果，而且与人类设计师有效合作。此外，它与Blender无缝集成，解锁了更大的操作可能性。

如图所示：3D-GPT采用LLM作为具有三个协作智体的多智体系统来进行程序化3D生成。这些智体从程序化生成器中查阅文档，推断函数参数，并生成Python代码。生成的代码脚本与Blender的API接口，用于3D内容创建和渲染。

添加图片注释，不超过 140 字（可选）