![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
扩散模型
文章平均质量分 92
向向2024
计算机视觉、多模态学习、大语言模型、医学图像分析、Diffusion 模型等,带你天天读论文
展开
-
Denoising Vision Transformers
我们深入探讨了视觉 transformer(ViT)内在的微妙但重要的挑战:这些模型的特征图显示出网格状伪影,这对 ViT 在下游任务中的性能产生了负面影响。我们的调查将这个问题追溯到输入阶段的位置编码。为解决这个问题,我们提出了一种新颖的噪声模型,该模型普遍适用于所有 ViT。具体来说,噪声模型将 ViT 输出分解为三个组成部分:一个不受噪声伪影影响的语义项和两个依赖于像素位置的伪影相关项。通过在每张图像的基础上强制跨视图特征一致性来实现这种分解,利用神经场。原创 2024-03-22 15:49:29 · 623 阅读 · 1 评论 -
【CVPR2024 】Mamba 再夺一城:DiffuSSM来了!没有注意力的扩散模型
本研究提出了一种无需注意力机制的扩散模型,通过引入Diffusion State Space Model (DIFFUSSM)架构,有效处理高分辨率图像生成问题,同时显著减少总FLOP使用量。原创 2024-03-18 10:06:26 · 2086 阅读 · 0 评论