一家叫做Show-1的公司搞的实验项目,这里面据说包含了:
- 多代理模拟器(multi-agent simulation):可以创建丰富的角色小传,人物使命和情感,具有前后一致性的故事线。我的理解是,用到了多个GPT账号的联合使用。
- GPT-4大语言模型: 大语言模型的自然语言生成能力,让对白创作变得极为简单,视频作者声称GPT-4早就吸收了大量南方公园的经典对白,以至于无需额外进行微调训练。唯一的技术含量,就是连锁提示词(prompt-chaining)技术的应用,让故事线变得前后一致。
- Diffusion视觉建模:训练了大约1200个人物角色(我的理解是,这个角色不同于人物角色,还涉及到不同服装等),600个背景场景建模,Dream Booth的Stable Diffusion是这里用到的主要工具。没什么新鲜的嘛。
- 语音克隆生成:提供角色语音。

基本流程

剧集生成
如果想看更多,请点击:https://www.kedashige.com/?p=518
视频可以通过https://hls.xuegre.com/projects/south_park观看