AIGC
文章平均质量分 96
文生图,Diffusion
念啊啊啊啊丶
路漫漫其修远兮,吾将上下而求索。
展开
-
【AIGC】2022-NIPS-视频扩散模型
生成时间连贯的高保真视频是生成模型研究的一个重要里程碑。我们提出了一种视频生成扩散模型,并取得了非常有希望的初步结果,朝着这一里程碑迈进了一步。我们的模型是标准图像扩散架构的自然延伸,它能够从图像和视频数据进行联合训练,我们发现这可以减少小批量梯度的方差并加快优化速度。为了生成长视频和高分辨率视频,我们引入了一种新的条件采样技术,用于空间和时间视频扩展,其性能优于以前提出的方法。我们展示了大型文本条件视频生成任务的第一批结果,以及视频预测和无条件视频生成的既定基准的最新结果。原创 2024-10-04 17:20:14 · 730 阅读 · 0 评论 -
【AIGC】2023-ICCV-使用 Transformer 的可扩展扩散模型
我们探索了一类基于 Transformer 架构的新型扩散模型。我们训练图像的潜在扩散模型,用在潜在 patchs 上运行的 Transformer 替换常用的 U-Net 主干。我们通过以 Gflops 为衡量标准的前向传递复杂度来分析我们的扩散 Transformer (DiT) 的可扩展性。我们发现,通过增加 Transformer 深度/宽度或增加输入 token 数量,具有更高 Gflops 的 DiT 始终具有较低的 FID。原创 2024-10-04 14:12:46 · 568 阅读 · 0 评论 -
【AIGC】2022-CVPR-利用潜在扩散模型进行高分辨率图像合成
通过将图像形成过程分解为去噪自动编码器的顺序应用,扩散模型 (DM) 在图像数据及其他方面实现了最先进的合成结果。此外,它们的公式允许使用引导机制来控制图像生成过程而无需重新训练。但是,由于这些模型通常直接在像素空间中运行,因此强大的 DM 的优化通常需要数百个 GPU 天,并且由于顺序评估,推理成本高昂。为了在有限的计算资源上进行 DM 训练,同时保持其质量和灵活性,我们将它们应用于强大的预训练自动编码器的潜在空间。原创 2024-10-03 10:39:01 · 873 阅读 · 0 评论 -
【AIGC】2020-NIPS-去噪扩散概率模型
我们使用扩散概率模型呈现了高质量的图像合成结果,扩散概率模型是一类受非平衡热力学启发的潜在变量模型。我们的最佳结果是通过对加权变分界限进行训练获得的,该界限是根据扩散概率模型与与朗之万动力学匹配的去噪分数之间的新联系而设计的,并且我们的模型自然地承认渐进式有损解压缩方案,该方案可以解释为自回归解码的泛化。在无条件 CIFAR10 数据集上,我们获得了 9.46 的初始分数和 3.17 的最先进的 FID 分数。在 256x256 LSUN 上,我们获得了与 ProgressiveGAN 类似的样本质量。原创 2024-10-02 22:20:11 · 474 阅读 · 0 评论