Diffusion模型(李宏毅)

一、几个图像生成方法:

VAE:

        类似于seq2seq

flow-based:

        训练和推理方向相反。

        为保证Encoder Invertible,Encoder输出的维度与输入图片维度相同,并且需要刻意限制架构。

diffusion:

        diffusion夹杂讯过程没有参数。

         

 这些后面都可以增添一个GAN。

二、denoising diffusion probablistic model(DDPM)

        step在一开始就已经定好了,并且是将同一个module重复使用多次,但不同的是在不同的是需要输入当前step,代表现在noise的程度。

         module内部根据当前step和输入图像预测杂讯,再用输入图像将其减去得到输出。这样折腾的原因是生成一张杂讯难度要比生成一张带杂讯的原图的难度小得多,如果一个module可以生成带杂讯的原图,那么其实它几乎也可以生成一张原图了。--------李宏毅

        关于Predicter的训练我们需要前向的加噪过程,找到对应的步骤作为Ground Truth。

前向过程称为Forward Process,或者DIffusion Process。 

三、Stable Diffusion, DALL-E, Imagen共用套路

        Text Encoder将文字变成向量

        Generator吃杂讯和Encoder的产物得到一个图片的压缩版本,这个压缩版本可能能看懂可能看不懂

        最后通过一个Decoder将图片由压缩版本还原。

 

四、原理剖析

训练

        

1,6:一直重复,直到收敛

2:从数据集中选出一张照片作为x0

3:t代表step,T是总step数

4:产生一个正态分布ε ,ε大小和图像大小一样

5:

        首先进行红色方框,就是加噪。加噪其实是是一个带权相加的过程,而不是每一个step加一点每一个step加一点的迭代。只需要在一开始给出所有step的权重â1,â2,...,âT,这些权重越来越小,既越往后的step原图X0的权重越小,噪音ε的权重越高。这里与第二节中的区别就是第二节中画的是一步一步逐渐加噪,这里是提前定好每一步加噪的权重,每一步都是单独的加噪。在下面这张图中叙述的很清晰。

        其次进行噪音预测,就是εθ函数,如上所述红框的内容是加噪后的图片,那么将红框与step t喂给εθ这个Noise predictor就得到了预测的噪音。

        然后计算真实噪音和预测噪音的MSELoss梯度下降。

推理

1:先生成一个服从正态分布的杂讯XT

2,5:for t in range(T,0,-1):

3:如果不是最后一步就再生成一个服从正态分布的杂讯z

4:Xt减去预测的杂讯得到杂讯更少的图片, 再加上Z。注意这里的α1,α2,...,αT也是提前给出的。

6:返回T次减少杂讯的图片X0。

关于为什么还要再加上一个杂讯z,李宏毅的解释是如果每一次都取最大概率,那么及其每一次输出都是重复的结果。

数学原理

目前看不懂。。。等我学会后再来补上。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Diffusion模型微调是指在已有的Diffusion模型基础上,对模型的参数进行调整和优化的过程。这个过程旨在提高模型的准确性和预测能力。 首先,Diffusion模型是一种描述信息扩散过程的数学模型,它可以用来模拟信息在社交网络中的传播、产品在市场中的推广等现象。在现实情况中,模型的参数往往需要根据具体场景进行微调。 微调Diffusion模型的方法主要包括以下几个步骤。首先,根据模型和场景的特点,选择合适的性能指标来衡量模型的表现。例如,如果模拟信息传播过程,则可以选择准确度、平均传播速度等指标。其次,对模型中的参数进行设置和调整。这包括确定传播速率、抑制因子、节点影响力等参数的数值。根据模型的特点,采用常用的统计学方法如最小二乘法、极大似然估计等进行参数估计,并根据实际数据进行模型拟合和优化。 另外,还可以使用一些优化算法来进行模型的微调,如遗传算法、粒子群优化算法等。这些算法可以通过自适应搜索和迭代优化来寻找最优的参数组合,提高模型的准确性。 最后,微调完Diffusion模型后,应该进行模型的验证和评估。这可以通过比较模拟结果和真实数据的对比来进行。如果模型的预测结果与实际数据吻合较好,那么说明微调后的模型是可信的。 综上所述,Diffusion模型微调是一个通过调整和优化参数来提高模型准确性和预测能力的过程。通过选择合适的性能指标、使用合适的参数估计方法和优化算法,并进行验证评估,可以使模型更好地适应不同的应用场景,提高模型的应用价值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值