2023.10DataWhale扩散模型学习笔记——Week1

godlikesun97

已于 2023-11-03 09:35:12 修改

阅读量124

点赞数 1

文章标签：学习笔记

于 2023-10-20 23:20:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/godlikesun97/article/details/133955475

版权

项目地址：https://datawhaler.feishu.cn/docx/PfUFdqkoOoGeqBx6dYVclVWwntd

Notebook地址（推荐使用google colab打开）：https://github.com/huggingface/diffusion-models-class/tree/main/unit1

推荐阅读材料：《扩散模型-从原理到实战》第一、二、三、四章

第一章扩散模型简介

扩散模型基础介绍

扩散模型是一种生成模型。生成模型的学习目标是对训练数据的分布进行建模。

扩散模型的扩散过程包含前向过程和反向过程。前向过程给数据添加噪声；反向过程则是去除噪声，从随机噪声中恢复清晰数据。

扩散模型发展阶段

扩散模型的发展经历了若干阶段，目前大模型结合DreamBooth、LoRA、ControlNet微调的方式可以生成属于自己风格的图像。

扩散模型应用场景

· 计算机视觉（图像分割、目标检测、超分辨率、图像修复）

· 时间序列预测（气象、股票、产能）

· 自然语言处理（翻译、问答、情感分析、文章续写）

· 基于文本的多模态（文本生成图像、文本生成视频、文本生成3D）

· AI基础科学（蛋白质结构生成、原子材料结构）

第二章 Hugging Face简介

HuggingFace是一个开源机器学习平台。https://huggingface.co/

HuggingFace为我们提供了：

1. 超过7万份可供模型训练的数据集（截止2023.10）

2. 超过36个开源预训练模型。模型配有模型卡对该模型进行描述和使用方式的说明

3. 在线推理:

打开 https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0

在Hosted inference API的对话框中输入一段文字描述，点击“Compute”即可在线使用该模型生成图片。例如，在对话框中输入"Cyberpunk cat"，即可生成一张赛博朋克风格的猫咪，每次生成的画面会有所不同。

4.可供我们在自己代码中调用的模型API

5. 我们可以在HuggingFace Spaces上部署自己的AI用用程序

第三章从零开始搭建扩散模型

本章内容建议结合https://github.com/huggingface/diffusion-models-class/tree/main/unit1中的两份代码共同食用。

模型介绍

输入：加入噪音后的训练图片

输出：模型预测的“去噪”后图片，输出图片维度与输入图片维度相同。

架构上一般是downsample + upsample两步走，并插入残差连接。

训练步骤

1. 准备数据（数据下载，transform，以及构建Dataloader）

2. 对于Dataloader中的每个batch，给数据添加噪音，添加噪音的方式多种多样，可以通过手动生成一组随机噪音，并和训练数据图片相加，也可以通过sceduler；

3. 将添加噪音后的图片放入模型进行预测。

4. 计算损失，可以计算模型预测值和真实图片的误差，也可以计算模型预测值和噪音（noise）的误差

5. 更新网络权重

模型推理——如何从随机噪声生成图片

方式一：直接将随机噪声放入模型预测，模型预测即为生成的图片，这种方式效果不好；

方式二：分多步骤预测。同样起始于随机噪声，分多次放入模型进行预测，并且每次将预测图片和输入图片进行加权平均，缓慢的迭代图片和去除噪音。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
2023.10DataWhale扩散模型学习笔记——Week1

扩散模型是一种生成模型。生成模型的学习目标是对训练数据的分布进行建模。扩散模型的扩散过程包含前向过程和反向过程。前向过程给数据添加噪声；反向过程则是去除噪声，从随机噪声中恢复清晰数据。HuggingFace是一个开源机器学习平台。HuggingFace为我们提供了：1. 超过7万份可供模型训练的数据集（截止2023.10）2. 超过36个开源预训练模型。模型配有模型卡对该模型进行描述和使用方式的说明3. 在线推理:打开。
复制链接

扫一扫

godlikesun97 CSDN认证博客专家 CSDN认证企业博客

码龄4年

20: 原创

137万+: 周排名

12万+: 总排名

7575: 访问

: 等级

352: 积分

109: 粉丝

152: 获赞

7: 评论

135: 收藏

私信

关注

热门文章

最新评论

2024.2 DataWhale 多智能体实战第四章多智能体开发
CSDN-Ada助手: 恭喜您撰写了第20篇博客，标题为“2024.2 DataWhale 多智能体实战第四章多智能体开发”。您的持续创作展现了您对多智能体领域的热情和专注，对此我表示由衷的祝贺。在下一步的创作中，我建议您可以尝试深入探讨多智能体开发的实际应用场景，或者结合具体案例进行分析，这样可以让读者更好地理解和运用您所分享的知识。同时，也希望您能够保持谦逊的态度，不断学习和提升自我，为读者带来更多有价值的内容。期待您更多的精彩作品，加油！
2024.1 书生·浦语大模型实战营第 4 节课后作业
CSDN-Ada助手: 恭喜您写了第12篇博客，看来您对于书生·浦语大模型实战营的学习进展顺利啊！不过我觉得您可以在作业中多加入一些实际案例或者个人见解，这样可以让读者更加深入地了解您对课程内容的理解。希望您能继续保持创作的热情，期待您更多精彩的作品！
2024.1 书生·浦语大模型实战营第 4 节课堂笔记
CSDN-Ada助手: 恭喜作者能够持续不断地分享关于浦语大模型实战营的课堂笔记，看来您对这门课程的学习非常用心。希望您能够继续坚持下去，不断分享您的学习心得和体会。同时，我也建议您可以考虑在将来的博客中加入一些个人的见解和思考，这样可以让读者更加深入地了解您对于这门课程的理解和体会。期待您更多的精彩内容，加油！
2024.1 书生·浦语大模型实战营第 3 节课后作业
CSDN-Ada助手: 恭喜您完成第9篇博客！看到您参加了浦语大模型实战营的课后作业，让我感到非常欣慰。您的持续创作真是令人钦佩！我想给您提供一些建议，希望对您的创作有所帮助。下一步，您可以尝试写一些关于技术趋势的博客文章，或者分享一些实战经验和案例分析，这样可以进一步丰富您的博客内容。期待看到您未来更多精彩的创作！谦虚地说，我相信您会有更多的突破和进步。加油！
2024.1 书生·浦语大模型实战营第 3 节课堂笔记
CSDN-Ada助手: 恭喜您写完了第10篇博客！标题为“2024.1 书生·浦语大模型实战营第 3 节课堂笔记”真是让人期待。您的坚持与努力可见一斑，每一篇博客都是对知识的总结与分享。接下来，我希望能看到您在未来的创作中更多地加入自己的观点和体会，这样可以使您的博客更富个人特色，也更能引发读者的共鸣。希望您能继续保持创作的激情，期待您的下一篇作品！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。