![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Diffusion Model专栏
文章平均质量分 94
Diffusion Model专栏
双木的木
种一棵树最好的时间是十年前,其次是现在。
展开
-
江大白 | 何凯明入职 MIT,首次带队提出Diffusion Loss,扩散模型思想提升生成速度和效果 !
在图像生成领域中,作者观察到并不是自回归建模的必要条件,并提出通过在连续值域上,操作的扩散过程来对每个标记的概率分布,进行建模。改进后的图像生成器在生成速度与效果上,都取得了巨大的提升。传统观点认为,用于通常伴随着向量量化标记。作者观察到,尽管离散值空间可以促进表示分类分布,但这并非自回归建模的必要条件。在这项工作中,作者提出使用扩散过程来建模每个标记的概率分布,这使得作者能够在连续值空间中应用自回归模型。原创 2024-06-30 21:17:58 · 696 阅读 · 0 评论 -
天才程序员周弈帆 | Stable Diffusion 解读(四):Diffusers实现源码解读
Diffusers是由Hugging Face维护的一套Diffusion框架。这个库的代码被封装进了一个Python模块里,我们可以在安装了Diffusers的Python环境中用import diffusers随时调用该库。相比之下,Diffusers的代码架构更加清楚,且各类Stable Diffusion的新技术都会及时集成进Diffusers库中。原创 2024-06-25 17:54:56 · 1490 阅读 · 0 评论 -
极市平台 | Mamba联名Diffusion?DiM:无需微调,高分辨图像生成更高效!
本文提出了一种新的基于Mamba的扩散模型 DiM,用于高效的高分辨率图像生成。Mamba 本是用于处理一维信号的模型,作者提出了几种有效的设计来使其能够对二维图像进行建模。原创 2024-06-13 17:58:59 · 1447 阅读 · 0 评论 -
极市平台 | 十分钟读懂Diffusion:图解Diffusion扩散模型
在之前的文章中,我们曾经介绍过Diffusion的具体原理,但是讲的还是比较偏理论,为了让大家快速了解Diffusion原理,这篇文章我们通过图解的方式。原创 2024-04-12 13:04:49 · 1198 阅读 · 0 评论 -
天才程序员周弈帆 | Stable Diffusion 解读(二):论文精读
简单来说,Stable Diffusion是一个两阶段的图像生成模型,它先用一个AE压缩图像,再在压缩图像所在的隐空间上用DDPM生成图像。在这篇文章中,我们来精读Stable Diffusion的论文:High-Resolution Image Synthesis with Latent Diffusion Models。原创 2024-06-10 10:16:27 · 1496 阅读 · 0 评论 -
GiantPandaCV | 一文弄懂 Diffusion Model,适合入门!(建议收藏)
最近AI 绘图非常的火,其背后用到的核心技术之一就是Diffusion Model(扩散模型),虽然想要完全弄懂 Diffusion Model 和其中复杂的公式推导需要掌握比较多的前置数学知识,但这并不妨碍我们去理解其原理。接下来会以笔者所理解的角度去讲解什么是 Diffusion Model。Diffusion Model 首先定义了一个前向扩散过程,总共包含T最左边的蓝色圆圈x0表示真实自然图像,对应下方的狗子图片。最右边的蓝色圆圈xT则表示纯高斯噪声,对应下方的噪声图片。原创 2024-02-13 22:10:31 · 1573 阅读 · 0 评论 -
新智元 | Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?
Stability AI放出了号称能暴打闭源模型的Stable Diffusion 3的技术报告,采用DiT构架的新模型在灵活性和性能上都达到了新的高度。,今天公布了详细的技术报告。论文深入分析了——改进版的Diffusion模型和一个基于DiT的文生图全新架构!原创 2024-03-12 22:05:40 · 1120 阅读 · 0 评论 -
天才程序员周弈帆 | Stable Diffusion 解读(一):回顾早期工作
Stable Diffusion由两类AE的变种发展而来,一类是有强大生成能力却需要耗费大量运算资源的DDPM,一类是能够以较高保真度压缩图像的VQVAE。Stable Diffusion是一个两阶段的图像生成模型,它先用一个使用KL正则化或VQ正则化的VQGAN来实现图像压缩,再用DDPM生成压缩图像。可以把额外的约束(如文字)输入进DDPM以实现带约束图像生成。原创 2024-06-08 20:48:29 · 1140 阅读 · 0 评论 -
天才程序员周弈帆 | Stable Diffusion 解读(三):原版实现源码解读(篇幅略长,建议收藏!)
看完了Stable Diffusion的论文,在最后这几篇文章里,我们来学习Stable Diffusion的代码实现。具体来说,我们会学习Stable Diffusion官方仓库及Diffusers开源库中有关采样算法和U-Net的代码,而不会学习有关训练、VAE、text encoder (CLIP) 的代码。如今大多数工作都只会用到预训练的Stable Diffusion,只学采样算法和U-Net代码就能理解大多数工作了。原创 2024-06-18 23:53:31 · 1307 阅读 · 0 评论