近期,Sora模型在人工智能领域掀起了巨大的轰动,其卓越的性能令人惊叹,而其未来可能带来的深远影响更是令人无限遐想。
然而,值得注意的是,尽管Sora模型表现出色,但其并未开源,这一点使得许多学者望而却步。此外,要想实现Sora模型的效果,不仅在技术层面,而且在资源方面都存在巨大的挑战,从而使得许多人望而生畏。
因此,北京大学信息工程学院助理教授、博士生导师袁粒,以及北京大学计算机学院教授、博士生导师田永鸿等一众专家发起了一项名为“Open Sora”的计划,旨在通过共同努力,推动Sora模型的复现工作
初步模型框架分为三部分:
- Video VQ-VAE.
- Denoising Diffusion Transformer.
- Condition Encoder.
在此,诚挚呼吁广大学者,不吝珍贵的技术经验,共同努力推动复现Sora模型的进程。