#今日论文推荐#清华提出CogVideo:最大的文本生成视频模型
一周不到,AI画师又“进阶”了,还是一个大跨步——
直接1句话生成视频的那种。
输入“一个下午在海滩上奔跑的女人”,立刻就蹦出一个4秒32帧的小片段:又或是输入“一颗燃烧的心”,就能看见一只被火焰包裹的心:这个最新的文本-视频生成AI,是清华&智源研究院出品的模型CogVideo。
论文题目:CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers
详细解读:https://www.aminer.cn/research_report/62a164d07cb68b460fcdf89a?download=false
https://www.aminer.cn/research_report/62a164d07cb68b460fcdf89a?download=false
AMiner链接:https://www.aminer.cn/?f=cs
2万+

被折叠的 条评论
为什么被折叠?



