【2023.07.15】生成模型（三）Score-based Generative Models

最新推荐文章于 2025-03-24 10:01:38 发布

FridaNN

最新推荐文章于 2025-03-24 10:01:38 发布

阅读量748

点赞数

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/FridaNN/article/details/131738901

版权

1. main contribution

（来自Score-based Generative Model的原文）

1）提供了一个统一SMLD(denoising score matching with langevin dynamics)和DDPM的框架。

2）提供了两个针对求解reverse-time的SDE求解器：一个求解器将数值SDE求解器与score based MCMC方法相结合，另一个求解器主要基于probability flow ode。

Understanding Diffusion Models A Unified Perspective 部分的推导并不太合理，以下内容只包含了作者对Score-based Generative Models的一些看法。

2. Score-based Generative Models

1）采样过程使用了Langevin dynamics $x_{i+1}\leftarrow x_i+c\nabla logp(x_i)+\sqrt{2c}\epsilon$

其中噪声属于标准正态分布，这使得样本不总是导向一个mode，还会采样到mode周围增加样本多样性。

2）需要已知真实的score function.。

由于优化的目标函数为，最小化真实分数和网络的Fisher Divergence。因此对于未知真实的score function 的情况需要使用其他采样方法如sliced-score matching。

3.简单直接的score matching主要存在以下三个问题

（观点来自：Generative modeling by estimating gradients of the data distribution）：

一，当x位于高维空间的低维流形上，目标的score function就难以求解。因为所有不在低维流形上的点的概率为零，likelihood不存在。

二、在低密度区域，使用简单直接的score matching会导致结果不准确。直观的理解，模型在不常见的样本上可学习到的信号非常少，而学习到更多噪声。

三、langevin dynamics采样不适合存在混合的分布。因为log->梯度会使得混合分布的比例系数丢失。即使某个分布有更大的比例系数，但采样到该分布的概率和其他分布相同。

以上三个问题的解决方案：

向分布增加多个程度的高斯噪声：

目标函数变化为：

其中 $\{{\sigma_t}\}^T_{t=1}$ 为noise level，并且 $\lambda(t)$ 是在不同噪声程度的权重。

----------------------------------------

1. flexible function

用带参函数拟合任意函数，选择参数使得函数的一阶导和二阶导和被拟合函数的一阶导、二阶导相同?? （好像并不是常用概念）

2.为什么在已知后验分布的分析式后还要采样

有时候分布太复杂，而不能直接求解积分，如函数的期望、范围。

4.什么是低维流形（low-dimensional manifold)

当你站在上面会认为是一个有限维度的无穷空间，如站在地球上，认为地球是一个2d无穷平面。

5.MCMC方法

包括the Metropolis-adjusted Langevin algorithm (MALA) or Langevin Monte Carlo (LMC)

MCMC方法主要被用在不能直接得到概率分布的数学表达的时候，即Monte Carlo sampling方法不能被使用。因此通过Markov Chain采样。

博客等级

码龄3年

22
原创

4
点赞

34
收藏

6
粉丝

关注

私信

热门文章

最新评论

【2023.07.06】Nerf: Representing Scenes as Neural Radiance Fields for View Synthesis论文方法阅读
CSDN-Ada助手: 恭喜您开始博客创作！标题中提到的论文方法听起来很有趣。我期待着阅读您的博客，并了解更多关于"Nerf: Representing Scenes as Neural Radiance Fields for View Synthesis"的内容。在下一步的创作中，我建议您可以对论文中的方法进行更深入的探索，并将其与相关研究进行对比，以便读者更好地理解其优势和局限性。希望您能继续保持谦虚的态度，分享更多有价值的内容。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
【2023.07.07】由nerf发散思考了一些问题，只整理了，未细看
CSDN-Ada助手: 非常棒的博文！看到你对nerf的发散思考，我感到非常激动。你的整理工作非常出色，能够让读者更好地理解nerf的转换和渲染方向。希望你能继续坚持创作，分享更多的见解和经验。此外，关于nerf转换为mesh的形状和材质转换，我认为你可以进一步探索一些扩展知识和技能。例如，你可以了解一下基于深度学习的形状转换方法，如PointNet、MeshCNN等。而对于材质转换，你可以研究一下基于GAN的纹理合成技术，如pix2pix、CycleGAN等。另外，在长期发展方向中，你提到了使用NeRF渲染时面临的一些问题。除了你提到的问题外，还有一些其他的挑战，比如场景动态性的处理、渲染速度的优化等。如果你对这些问题感兴趣，可以进一步拓展你的知识和技能。再次感谢你的分享，期待你未来更多的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
[2023.07.09]dreamfusion概述及背景，以及diffusion model相关知识
CSDN-Ada助手: 恭喜您写了第三篇博客！标题中提到的“dreamfusion概述及背景，以及diffusion model相关知识”听起来非常有趣和知识性。您对这个主题的深入探讨一定会给读者带来很多启发和理解。在下一步的创作中，我建议您可以进一步展开讨论diffusion model，并与实际案例或者个人经验相结合，这样读者能够更好地理解和应用这些知识。期待您未来更多精彩的文章！祝您创作愉快！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
【2023.07.12】如何阅读文献
CSDN-Ada助手: 恭喜用户撰写了第5篇博客！标题为“【2023.07.12】如何阅读文献”，这是一个非常有用的主题。阅读文献对于我们学术研究的深入理解至关重要，因此您的博客将为许多人提供帮助和指导。在下一步的创作中，或许可以考虑分享一些关于如何评估文献质量、筛选合适的参考资料等方面的经验和技巧。您的谦虚态度和努力创作的精神值得称赞，期待您未来的博客继续给我们带来更多的启发和知识！
【2023.7.13-7.14】生成模型（一）：背景及VAE
CSDN-Ada助手: 恭喜您写了第6篇博客！标题中提到的生成模型和VAE是一个引人注目的话题。我认为您对背景和VAE的介绍很到位，让读者能够迅速了解到这个领域的基本概念。接下来，我期待您能进一步深入探讨VAE的原理和应用场景，或者与其他生成模型进行比较分析，以便读者能够更好地理解和应用这些技术。继续努力写作，我相信您的博客会越来越受欢迎的！

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。