AIGC
文章平均质量分 76
yang_daxia
这个作者很懒,什么都没留下…
展开
-
论文阅读Vlogger: Make Your Dream A Vlog
论文介绍了一个名为“Vlogger”的通用人工智能系统,它能够根据用户的描述生成分钟级的视频博客(vlog)。与通常只有几秒钟的短视频不同,vlog通常包含复杂的故事情节和多样化的场景,这对现有的视频生成方法来说是一个挑战。剧本(Script):使用LLM根据用户故事创建剧本,描述多个拍摄场景及其相应的拍摄时长。演员(Actor):根据剧本总结角色,并使用角色设计师生成这些角色的参考图像。原创 2024-06-27 11:34:38 · 934 阅读 · 1 评论 -
大模型SFT
supervised fine-tuning的缩写,即有监督的微调。如应用到一个新的场景,就可以使用SFT。原创 2024-06-06 22:12:56 · 534 阅读 · 0 评论 -
Stable Diffusion原理
目前常采用的定量指标是FID(Fréchet inception distance)和CLIP score,其中FID可以衡量生成图像的逼真度(image fidelity),而CLIP score评测的是生成的图像与输入文本的一致性,其中FID越低越好,而CLIP score是越大越好。训练条件扩散模型时,往往会采用Classifier-Free Guidance(这里简称为CFG),同时训练一个无条件的扩散模型(以一定的比例是text为‘’),然后将两者加权,可以改善最终的生成质量。原创 2024-06-05 22:47:44 · 1166 阅读 · 0 评论 -
how-diffusion-models-work课程学习
扩散模型可以用于图像生成、图像编辑、音乐生成等领域。后续学习更好的sampling、stable diffusion参考:https://learn.deeplearning.ai/courses/diffusion-models/p=1。原创 2024-05-17 15:11:33 · 362 阅读 · 0 评论
分享