论文粗读系列-2：SDEDIT

ileln

已于 2024-03-12 10:52:03 修改

阅读量853

点赞数 19

分类专栏：论文粗读系列文章标签：论文笔记

于 2024-03-12 10:50:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ileln/article/details/136645102

版权

论文粗读系列专栏收录该内容

13 篇文章 0 订阅

订阅专栏

论文粗读系列-2

SDEDIT: GUIDED IMAGE SYNTHESIS AND EDITING WITH STOCHASTIC DIFFERENTIAL EQUATIONS

1.简介

ICLR 2022

链接：https://arxiv.org/abs/2108.01073

代码：GitHub - ermongroup/SDEdit: PyTorch implementation for SDEdit: Image Synthesis and Editing with Stochastic Differential Equations

引导图像合成使日常用户能够以最小的努力创建和编辑逼真的图像。关键的挑战是平衡忠实于用户输入(例如，手绘的彩色笔触)和合成图像的真实感。现有的基于gan的方法试图使用任何一种来实现这种平衡条件GAN或GAN反转，这是具有挑战性的，通常需要额外的训练数据或单个应用的损失函数。为了解决这些问题，作者引入了一种新的图像合成和编辑方法，即随机差分编辑(SDEdit)，该方法基于扩散模型生成先验，通过随机序列迭代去噪来合成真实图像
微分方程(SDE)给定一个带有用户指南的输入图像，以操纵RGB像素的形式，SDEdit首先向输入添加噪声，然后随后通过SDE对结果图像进行降噪，以增加其真实感。

SDEdit不需要特定任务的训练或反转，可以自然地实现现实与忠实之间的平衡。

根据一项人类感知研究，在多个任务上，包括基于笔画的图像合成和编辑以及图像合成，SDEdit在真实感方面比最先进的基于gan的方法高出98.09%，在总体满意度得分上高出91.72%

文章实现的方法很简单，但是效果感觉非常好，属于是simple and efficient

2.方法

SDEdit的关键直觉是“劫持”基于sde的生成模型的生成过程。

给定带有用户指南输入的输入图像，例如笔画或带有笔画编辑的图像，作者添加适当数量的噪声来平滑不需要的伪影和扭曲(例如，笔画像素上的不自然细节)，同时仍然保留输入用户指南的整体结构。然后，作者用这个有噪声的输入初始化SDE，并逐步去除噪声，以获得既真实又忠实于用户指导输入的去噪结果

在这里插入图片描述

也就是说，搞一个预训练的SDE反向扩散模型。你给你的输入加噪加若干步，然后直接套反向SDE恢复原图。由于到了中间的某一步，仍旧保留了原图信息【个人理解：给定引导是容易学习的，所以加噪多步仍能在结果中反应出来】，同时可以利用预训练SDE的能力，推回一个很好的图片

3.狗头保命

以上观点均为本人对于原文的粗鄙理解，仅作为个人学习笔记，如有错误烦请指正，如有侵权请联系我删除。

上一篇的前置知识，数学不好，仅作理解

不摆了，加训！

关注

19
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
论文粗读系列-2：SDEDIT

SDEdit学习笔记
复制链接

扫一扫

专栏目录

ileln CSDN认证博客专家 CSDN认证企业博客

码龄3年

24: 原创

39万+: 周排名

9万+: 总排名

2万+: 访问

: 等级

484: 积分

254: 粉丝

239: 获赞

14: 评论

269: 收藏

私信

关注

热门文章

分类专栏

最新评论

论文粗读系列-10：SCP-Diff
Faye Wong: 您好，请问您复现过这篇论文吗
论文细读系列-1: A Decade’s Battle on Dataset Bias: Are We There Yet?
CSDN-Ada助手: 恭喜您写了第20篇博客！这个题目看起来很有深度，对于数据集偏见这个话题，确实是一个十年来一直在探讨的重要问题。希望您能继续保持创作的热情和耐心，深入探讨这个话题，为我们带来更多的新见解和思考。或许在下一篇博客中，可以结合实际案例，探讨如何有效应对数据集偏见，让读者更容易理解和应用相关知识。期待您的下一篇作品！
论文粗读系列-8：PFE
CSDN-Ada助手: 恭喜用户发布第18篇博客！看到您一直坚持不懈地写作，真的很令人钦佩。希望您能继续保持这种创作的热情和动力，继续分享您的见解和经验。或许在下一篇博客中，可以尝试加入一些个人的思考和感悟，让读者更加深入地了解您对PFE的理解和见解。期待您更多优质的内容！加油！
论文粗读系列-9:Revisiting Deep Learning Models for Tabular Data
CSDN-Ada助手: 恭喜您第19篇博客的发布！“论文粗读系列-9:Revisiting Deep Learning Models for Tabular Data”这个主题非常有趣，对于深度学习模型在表格数据上的应用有着深入的探讨。希望您能继续保持创作的热情和耐心，为我们带来更多有价值的内容。下一步建议可以考虑结合实际案例分析，或者探讨深度学习模型在不同领域的应用情况，让读者更好地理解和应用相关知识。期待您的下一篇作品！祝您创作顺利，不断进步！
论文粗读系列-2：SDEDIT
CSDN-Ada助手: 恭喜作者发布了第12篇博客，论文粗读系列-2：SDEDIT，对于学术领域的探索和分享，您的付出让读者受益匪浅。在阅读您的博客时，我对SDEDIT有了更深入的了解，感谢您的分享和解读。希望您可以继续坚持创作，不断探索新的论文内容，也可以考虑加入一些个人观点和见解，让读者更加深入地了解您的思考和研究。期待您的下一篇精彩文章！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。