2024年7月26日,智谱AI CEO张鹏在智谱Open Day上宣布,AI生成视频模型“清影”(Ying)正式上线智谱清言。这个新模型能够在30秒内生成6秒的视频,并为所有C端用户提供AI文生视频和图生视频的功能体验。
张鹏在发布会上表示:“我们在模型层面积极探索更高效的scaling方式。随着算法和数据的不断迭代,相信Scaling Law(规模定律)将继续发挥强有力的作用。”他强调,生成式视频模型的研发离不开Scaling Law在算法和数据两个方面的推动。
“清影”模型的底座是CogVideoX,这一视频生成模型结合了文本、时间和空间三个维度,参考了Sora的算法设计,并采用了DiT(Diffusion Transformer)架构。通过优化,CogVideoX相比其前代模型CogVideo,推理速度提升了6倍。张鹏透露,团队将继续努力迭代,在后续版本中陆续推出更高分辨率和更长时长的生成视频功能。
此外,清影API现已同步上线大模型开放平台bigmodel.cn,企业和开发者可以通过调用API体验和使用文生视频及图生视频的模型能力。用户只需输入一段文字(Prompt),即可选择生成风格,包括卡通3D、黑白、油画、电影感等,再配上清影自带的音乐,最终生成充满AI想象力的视频片段。
清影还带来了更多的新玩法,包括表情包梗图、广告制作、剧情创作和短视频创作等,丰富了用户的创作选择。
张鹏在发布会最后总结道:“随着算法和数据的不断迭代,我们相信Scaling Law将继续在生成式视频模型的研发中发挥关键作用,为用户带来更加高效和创新的体验。”