扩散模型中的UNET

一、为什么UNET模型可以用于去噪网络

下采样部分: 能够提取图像的深层次特征,这些特征往往包含图像的重要结构和信息,而噪声通常被视为不相关的随机信息。通过卷积层的逐层处理,噪声信息在特征提取过程中被逐渐削弱。
上采样部分: 利用上采样和卷积操作恢复图像的尺寸和细节。跳跃连接结构将编码器的特征图直接传递给解码器,使得解码器能够利用更多的信息来恢复图像的细节,同时避免信息丢失和模糊。

二、扩散模型中的UNET是一个条件去噪网络,怎么实现的

我们知道普通的UNET是一个单独的去噪网络,扩散模型中的UNET是一个条件去噪网络,那这个条件去噪网络是怎么实现的呢,答案就是time embedding,实现过程如下图所示,我们可以把这个过程理解为一个查表操作,根据输入t,按照PositionalEmbedding 查找对应特征向量,再经过线性和非线性变换,最终得到一个指示向量,目的是告诉去噪网络,我现在在做的是第t步的去噪。
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值