- 博客(622)
- 收藏
- 关注
原创 小白也能读懂DALL·E系列模型讲解
DALL·E 系列(包括 DALL·E 1、DALL·E 2 和 DALL·E 3)并没有完全开源,论文中仅公开部分内容和工具。下面是针对DALL·E系列中公开的论文进行的解读。
2024-12-07 21:08:31
476
原创 小白也能读懂的AIGC扩散(Diffusion)模型系列讲解
小白也能读懂的AIGC扩散(Diffusion)模型系列讲解,持续更新SD模型及其微调方法和原理。
2024-11-16 00:59:20
1323
原创 数据结构(严蔚敏C语言版)代码实现持续更新中
文章汇总:线性表:线性表的顺序表示和实现线性表的链式表示和实现静态链表的表示和实现栈:顺序栈——栈的顺序表示和实现链栈——栈的链式表示和实现队列:链队列——队列的链式表示和实现顺序队列——队列的顺序表示和实现(书上没有,自己总结的,书中用顺序队列用来实现循环队列,读者可忽略,感兴趣的可以看一下,帮我纠正)循环队列——队列的顺序表示和实现...
2020-02-28 20:05:26
6143
2
原创 DALL·E 3模型及其论文详解
详细介绍DALL·E 3的模型架构和训练过程,详细解读其论文《Improving Image Generation with Better Captions》。
2024-12-07 20:46:34
4659
原创 DALL·E 2模型及其论文详解
详细介绍DALL·E 2的模型架构和训练过程,详细解读其论文《Hierarchical Text-Conditional Image Generation with CLIP Latents》。
2024-12-06 10:15:00
2940
原创 DALL·E模型及其论文详解
详细介绍DALL·E的模型架构和训练过程,详细解读其论文《Zero-Shot Text-to-Image Generation》。
2024-12-05 14:28:08
3382
原创 万字长文解读深度学习——dVAE(DALL·E的核心部件)
详细介绍DALL·E的核心部件之一——dVAE,在VQ-VAE的基础上使用Gumbel-Softmax实现采样,用于图像生成。
2024-12-04 16:59:41
2292
原创 万字长文解读深度学习——VQ-VAE和VQ-VAE-2
本文详细介绍VQ-VAE和VQ-VAE-2的原理和训练过程,为后面的dVAE在DALLE中的使用打下坚实的基础。
2024-12-04 09:46:35
4222
原创 深度学习面试八股总结
下面是本人在面试中整理的资料和文字,主要针对深度学习面试八股做浅显的总结,大部分来源于ChatGPT,中间有借鉴一些博主的优质文章,已经在各文中指出原文。。文章系列图像使用》插图。
2024-12-02 17:42:35
743
原创 机器学习面试八股总结
下面是本人在面试中整理的资料和文字,主要针对机器学习面试八股做浅显的总结,大部分来源于ChatGPT,中间有借鉴一些博主的优质文章,已经在各文中指出原文。。文章系列图像使用》插图。
2024-12-02 17:39:40
1086
原创 SD3的采样下篇——Rectified Flow
SD3模型的采样方法下篇——Rectified Flow。号称最强模型之一的文生图模型使用的采样方法,和之前的SD系列模型完全不一样的采样方法。
2024-11-27 16:25:54
2869
原创 SD3的采样上篇——Flow Matching
SD3模型的采样方法上篇——Flow Matching。号称最强模型之一的文生图模型使用的采样方法,和之前的SD系列模型完全不一样的采样方法。
2024-11-27 11:36:40
6307
8
原创 FLUX.1概要——原SD核心团队推出的最强文生图
简要介绍——目前最强文生图FLUX.1模型。原SD核心团队重建的Black Forest Labs(黑森林实验室)推出。
2024-11-26 00:42:16
3387
1
原创 DiT(Diffusion Transformer)详解——AIGC时代的新宠儿
本文详细介绍DiT(Diffusion Transformer)了,DiT作为AIGC时代的新宠儿,将Transformer和Diffusion结合,在图像和视频生成
2024-11-25 15:27:08
14767
3
原创 深度学习——3种常见的Transformer位置编码【sin/cos、基于频率的二维位置编码(2D Frequency Embeddings)、RoPE】
介绍3种常见的Transformer位置编码——正弦/余弦位置编码(sin/cos)、基于频率的二维位置编码(2D Frequency Embeddings)、旋转式位置编码(RoPE)
2024-11-25 10:41:41
2886
原创 SD模型微调之Textual Inversion和Embedding fine-tuning
SD模型微调方法Textual Inversion详细介绍,包括数据集准备,模型微调过程,推理过程,优缺点等。
2024-11-19 20:46:32
1350
原创 Stable Diffusion经典应用场景
介绍Stable Diffusion经典应用场景文本:生成图像(txt2img)、图像生成图像(img2img)、图像重绘(Inpainting)、图像的可控生成(使用ControlNet辅助生成)、图像超分辨率重建。
2024-11-18 22:15:59
2002
原创 Stable Diffusion中U-Net的前世今生与核心知识
U-Net的介绍,包括传统的U-Net和SD模型中的U-Net,推理、训练过程。
2024-11-18 20:26:21
2187
原创 Stable Diffusion核心网络结构——U-Net
详细介绍Stable Diffusion核心网络结构——U-Net,作用,架构,加噪去噪过程损失函数等。
2024-11-18 17:01:32
4792
原创 Stable Diffusion核心网络结构——CLIP Text Encoder
详细介绍Stable Diffusion核心网络结构——CLIP,作用,架构等。
2024-11-18 15:49:14
3460
原创 Stable Diffusion核心网络结构——VAE
详细介绍Stable Diffusion核心网络结构——VAE,作用,架构,损失函数等。
2024-11-18 15:23:33
5338
1
原创 Stable Diffusion概要讲解
Stable Diffusion概要介绍一下,Stable Diffusion 是一个算法,Stable 是稳定的,Diffusion 是扩散,所以Stable Diffusion就是一种稳定的扩散的算法。
2024-11-17 11:03:06
2028
原创 万字解读机器学习——Boosting中常用算法(GBDT、XGBoost、LightGBM)迭代路径
面试资料收集者之万字解读机器学习——Boosting中常用算法(GBDT、XGBoost、LightGBM)迭代路径
2024-11-12 14:12:05
1058
原创 万字长文解读机器学习——集成学习、Bagging(随机森林)、Boosting(AdaBoost、GBDT、XGBoost、LightGBM)、Stacking
面试资料收集者之万字长文解读【万字长文解读机器学习——集成学习、Bagging(随机森林)、Boosting(AdaBoost、GBDT、XGBoost、LightGBM)、Stacking】
2024-11-12 13:23:20
761
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅