AIGC
文章平均质量分 95
Yez1011
智能系瓜皮学生一枚!
展开
-
DatasetDM论文解读
该模型基于预训练的扩散模型,并将文本引导图像合成扩展到感知数据生成领域。通过解码扩散模型的丰富潜在编码,可以有效地生成准确的感知注释。训练该解码器只需要少于1%(大约100张图像)的手动标注图像,从而实现无限大的注释数据集生成。生成的合成数据可用于训练各种感知模型进行下游任务。原创 2023-08-31 16:55:05 · 427 阅读 · 1 评论 -
Multimodal-driven Talking Face Generation via a Unified Diffusion-based Generator(论文解读和个人理解)
一样的,为了避免后面自己再看的时候忘记,做个阅读记录,其实最近陆陆续续读了很多文章,但是,很多没有精读,也就没有记录。感觉真的是好记性不如烂笔头,能学多少是多少吧,,,这篇论文我觉得是很优秀的工作(当然了),但是,缺点就是没开源,期待开源,很好奇它们怎么做的,,,还有就是,,,这个工作感觉很通用,但是很fashion,不多评价,毕竟能做出这些工作的都是大佬,膜拜!还有就是,如果我讲错了,请评论指出,友好讨论,作者学识有限!原创 2023-05-17 18:43:46 · 378 阅读 · 0 评论 -
最近读的AIGC相关论文思路解读
本博客是作者本人最近对AIGC领域相关论文调研后,临时记录所用,所有观点都是来自作者本人局限理解,以及个人思考,不代表对。原创 2023-04-18 10:41:18 · 1922 阅读 · 0 评论