- 博客(4)
- 收藏
- 关注
转载 图片对嘴生成视频:HunyuanVideo-Avatar
仅需一张包含人物全身或半身的照片和一段音频,就能生成一个高质量、动作自然、口型同步的说话视频。这里的关键词是"One-shot" (单样本),意味着你不需要为特定人物录制几分钟甚至几小时的视频来进行模型训练,大大降低了生成数字人视频的门槛。它生成的不再是简单的“大头贴”式说话视频,而是包含自然头部姿态和身体动作的全身 (full-body)视频。该项目的技术基于一篇名为的学术论文,代表了腾讯在视频生成和数字人领域的前沿研究成果。
2025-07-22 05:15:17
55
转载 AppBox拖拽设计增删改查用户界面
之前为了应对客制化大屏设计的需求,在框架内实现了拖拽方式(动态化)生成用户界面的功能,跟大部分实现方式差不多,设计时生成配置json,然后在运行时解析json生成用户界面。这次完善了一下该功能,支持类似于零代码平台生成增删改查界面,下面简单介绍一下操作步骤。
2025-07-21 15:22:41
28
转载 垃圾qt,毁我青春
在软件开发的漫漫征途中,我与 Qt 的邂逅本以为是一场美妙的合作,然而,现实却给了我沉重的一击。“垃圾 qt,毁我青春”,这句看似过激的话语,实则饱含了我在 Qt 开发之路上的无数辛酸与无奈。
2025-06-29 12:07:16
16
转载 MoD:轻量化、高效、强大的新型卷积结构 | ACCV'24
来源:晓飞的算法工程笔记 公众号,转载请注明出处论文: CNN Mixture-of-Depths论文地址:https://arxiv.org/abs/2409.17016创新点提出新的卷积轻量化结构MoD,在卷积块(Conv-Blocks)内通过动态选择特征图中的关键通道进行集中处理,提高效率。CNN MoD保留了静态计算图,这提高了训练和推理的时间效率,而且不需要定制...
2024-11-19 02:31:28
265
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅