自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

rlyhh的博客

原创 AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning

虽然使用 DreamBooth 或 LoRA 训练的个性化文本到图像模型已经成功地通过它们的非凡的视觉质量引起了注意力，但它们的输出是静态图像。也就是说，缺乏时间自由度。我们提出一种通用型方法以实现为任何个性化 T2I 模型生成动画图像的能力，不需要特定于模型的调整工作并随着时间的推移实现吸引人的内容一致性。大多数的T2I都是来自相同的模型，但是想到做到不同的个性化就需要不同的数据集来训练，显然这是不现实的，所以转为设计一个运动建模模块，他可以引入到T2I模型中然后微调以达到个性化的要求。

2024-03-22 16:09:36 1690

原创 SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models

虽然T2I和T2V的发展很迅速，但是文本提示本质上的抽象的表达，很难准确的定义其复杂的语义，例如空间布局、姿势和形状。在本文中，我们介绍了 SparseCtrl，这是一种有效的方法，旨在通过带有附加编码器的时间稀疏条件图来控制文本到视频的生成。它在保留原始生成器的完整性的同时实现了辅助编码器。为了实现这一点，我们设计了一个条件编码器，配备了时间感知层，将稀疏条件信号从条件关键帧传播到无条件帧。

2024-03-21 13:53:35 1750

原创 Text2Performer: Text-Driven Human Video Generation

现有的文本驱动任务大多需要依赖数量庞大的数据集来训练，虽然显示出的性能优越，但是在应用于某些特定任务时无法生成合理的结果。文本驱动的人类视频生成有几个挑战：1人体结构是铰接式的。2在执行复杂运动时，人体的外观应该保持不变。为了对复杂的人体运动进行建模，提出了一种新的连续VQ扩散器来对一系列有意义的姿态表示进行采样。

2024-03-20 15:48:15 1308

空空如也

在jupyter上运行这段代码后报错Operation not permitted: './results/all_frames/000.png'"请问该如何解决呀

2024-03-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

错了硬改丶 CSDN认证博客专家 CSDN认证企业博客

码龄5年

IP 属地：四川省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

3: 原创

127万+: 周排名

17万+: 总排名

4746: 访问

: 等级

145: 积分

85: 粉丝

114: 获赞

0: 评论

48: 收藏

私信

关注

热门文章

最新评论

AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning
CSDN-Ada助手: 恭喜您发布了第三篇博客“AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning”！您的研究内容看起来非常有趣和具有实用性。希望您能继续坚持创作，分享更多关于个性化文本到图像扩散模型的知识和经验。或许下一步可以考虑深入探讨模型的性能优化和应用场景拓展，这样读者们会更加受益。期待您未来更多精彩的作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models
CSDN-Ada助手: 非常感谢您分享这篇关于SparseCtrl的博客！您的研究对于改进文本到视频生成模型的控制效果具有重要意义。除了介绍SparseCtrl这一有效方法，您还可以继续探讨如何在不同场景下应用该技术，比如在视频编辑、虚拟现实等领域的潜在应用。同时，您也可以考虑探讨如何进一步优化稀疏条件信号传播的效率，以提高模型的生成效果。希望您能继续分享更多关于文本到视频生成模型的研究成果，期待您的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Text2Performer: Text-Driven Human Video Generation
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

提示

确定要删除当前文章？

取消删除