扩散模型
文章平均质量分 78
。。。。。。。。。。。
小杨小杨1
这个作者很懒,什么都没留下…
展开
-
一个Transformer在尺度上适合多模态扩散的所有分布
本文提出了一个统一的扩散框架(UniDiffuser)来拟合一个模型中与一组多模态数据相关的所有分布。我们的关键观点是——边缘分布、条件分布和联合分布的学习扩散模型可以统一为预测扰动数据中的噪声,其中扰动水平(即时间步长)对于不同的模态可能是不同的。受统一视图的启发,UniDiffuser同时学习所有分布,对原始扩散模型进行最小的修改-扰动所有模态的数据,而不是单一模态,输入不同模态的单个时间步长,预测所有模态的噪声,而不是单一模态.原创 2023-07-11 10:15:44 · 1319 阅读 · 0 评论 -
MedSegDiff-V2
为了有效地弥合扩散噪声嵌入和条件语义特征之间的差距,提出了一种新的transformer机制,称为频谱空间变压器(SS-Former),学习它们之间的相互作用。这使得模型具有更小的扩散方差,同时还受益于transformer提供的全局和动态表示能力。第一个模块将扩散噪声嵌入编码为条件语义嵌入,第二个模块将混合噪声的语义嵌入编码为扩散噪声嵌入。这使得模型能够学习噪声和语义特征之间的交互,并实现更强的表示。将基于transformer的UNet(如TransUNet)与DPM结合起来的策略导致了欠佳的表现。原创 2023-03-09 12:18:53 · 2066 阅读 · 3 评论 -
MedSegDiff
EIt是条件特征嵌入,本文中是原始图像嵌入,Ext是当前步骤的分割地图特征嵌入。步长索引t与添加的嵌入和解码器特性集成在一起。在每一种方法中,都使用共享的学习查找表进行嵌入。与空间注意不同,它对特定频率的分量进行全局调整。因此,可以学习约束高频分量进行自适应融合。主要思想:学习应用于傅里叶空间特征的参数化注意(权重)映射。FF-Parser可以看作是频率滤波器的一个可学习版本。验证所提出的动态调节和FF-Parser的有效性。作用:约束xt特征中与噪声相关的分量。损失函数:Unet中恢复噪声/图像。原创 2023-03-09 10:21:38 · 1368 阅读 · 1 评论