腾讯混元大模型，上线AI视频，并且开源

最新推荐文章于 2025-03-21 07:30:00 发布

悟空码字

最新推荐文章于 2025-03-21 07:30:00 发布

阅读量639

点赞数 6

分类专栏： AI 文章标签：腾讯混元大模型 AI视频

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LiuAustin/article/details/144257359

版权

AI 专栏收录该内容

34 篇文章

订阅专栏

大家好，我是小悟。

腾讯混元大模型发布，其视频生成能力已经正式上线，并且作为一项重要的里程碑，该模型也选择了开源，向全球开发者共享这一先进技术。

腾讯混元大模型的视频生成功能，允许用户通过简单的文本描述，快速生成高质量的视频内容。

已上线腾讯元宝APP，企业客户通过腾讯云提供服务接入，目前API同步开放内测申请。

无论是中文还是英文输入，该模型都能轻松应对，并支持多种视频尺寸和清晰度的选择。这一功能的推出，无疑将极大地丰富内容创作的手段和效率。

值得一提的是，腾讯混元大模型在视频生成的质量上也达到了新的高度。经过与国际顶尖模型的对比评测，其在文本与视频的一致性、运动流畅性和画面细腻度等多个关键指标上均表现出色。

特别是在处理复杂场景，如人物动态和人造环境时，该模型展现出了卓越的能力。

这些技术成果的背后，是腾讯在人工智能领域持续不断的研发投入和创新精神。据悉，腾讯混元大模型采用了先进的DiT架构，并在此基础上进行了多项重要升级。

包括更高效的文本编码器、全局注意力机制以及混合变分自编码器等。这些创新技术共同作用，使得模型在视频生成任务上取得了突破性的进展。

比如下面这几个就是由腾讯混元视频生成。

提示词：一只熊猫在上海街头骑单车，写实风格。

在这里插入图片描述

提示词：俯瞰超广角，全景深。清晨，第一缕阳光照亮长城蜿蜒轮廓，画面中一只戴红围巾的企鹅昂首挺胸，步伐稳健前行。背景长城砖石古朴，与红围巾形成鲜明对比。整体色调温暖，突出历史沧桑与生命活力。

在这里插入图片描述

提示词：特写镜头拍摄的是一位 60 多岁、留着胡须的灰发男子，他坐在巴黎的一家咖啡馆里，沉思着宇宙的历史，他的眼睛聚焦在画外走动的人们身上，而他自己则基本一动不动地坐着，他身穿羊毛大衣西装外套，内衬系扣衬衫，戴着棕色贝雷帽和眼镜，看上去很有教授风范，片尾他露出一丝微妙的闭嘴微笑，仿佛找到了生命之谜的答案，灯光非常具有电影感，金色的灯光，背景是巴黎的街道和城市，景深，35 毫米电影胶片。

在这里插入图片描述

更为重要的是，腾讯此次选择将这一先进模型开源，体现了其对行业发展的深远洞察和推动责任。

通过Hugging Face平台和Github的开源发布，企业与个人开发者都可以免费获取和使用这一模型，进行二次开发和应用创新。

这不仅将加速视频生成技术的普及和应用，也将为相关行业带来更多的发展机遇和可能性。

在这里插入图片描述

随着腾讯混元大模型视频生成能力的不断完善和优化，它将在内容创作、影视制作、游戏开发等多个领域发挥更大的作用，推动人工智能技术的进一步发展和应用。

您的一键三连，是我更新的最大动力，谢谢

山水有相逢，来日皆可期，谢谢阅读，我们再会

我手中的金箍棒，上能通天，下能探海

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

悟空码字 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。