- 博客(31)
- 收藏
- 关注
原创 文生图个性化人像tuning-free论文梳理
文生图个性化人像tunning-free的方法中,主要集中在:1)如何更加准确有效地提取人脸图像中的面部信息,2)如何更加有效地将面部信息传入到文生图网络中,3)使用loss等约束人脸信息对文生图网络的过度影响,保持文本可编辑性和原有的生成能力。
2024-09-02 17:19:15 868
原创 Tune-A-Video
Text-to-image (T2I) 其实现在已经取得比较大成功了,但是在 text-to-video (T2V) 领域,目前还是相对落后的,为什么呢?因为它计算是非常昂贵的。本文提出了一个 T2V generation setting,通过一个 one-shot video tuning, one shot 就是 base T2I model,只需要一条视频去做一下 fine-tuning,这样就能在这条视频上进行一些编辑,比如说把人换成钢铁侠,类似于这样的操作。
2024-03-18 10:06:16 833
原创 Stable Video Diffusion: Scaling Latent Video Diffusion Models to large Data. SVD论文解读
之前普遍用的是方法是:2D 图像上去训练文生图模型,然后插入时间序列层,在小的高质量的视频数据集上进行微调。但是存在的问题:1)使用小视频数据集是不符合目前大数据的趋势的。2)目前的视频数据集缺少一个统一的有效的策略去管理。作者本文针对这个问题提出一套比较流程化的有效的视频数据治理的手段。作者提出了一个三步走的步骤:1)text-to-image pretraining 文生图预训练:实际上就是指我们目前已有的文生图的 stable diffusion base model。
2023-11-27 13:23:22 1062
原创 DreamBooth 论文精读+通俗理解
如今 AI 生成已经有很大的发展,但是这些模型都缺少能够通过一个给定的很小量的 reference set ,去模仿生成该 set 中所指定 subject 的图片。这种针对特定物体的生成,在此前绝大部分的生成模型都是做不到的。在这篇文章中,作者提出了一个新的方法 DreamBooth,用来个性化文生图 diffusion models。
2023-10-02 18:32:05 4072 1
原创 PrivaceFace 论文解读
在对 GPU 显存的占用方面,因为他们在 server 端有一次额外的训练,所以在我们模拟的时候,它其实多占了 1000 多兆的显存,而我们只是在训练的 loss 后面加了几项,所以我们的额外的显存也是很小的。(b) 研究了在不同的 privacy cost 下的性能变化,红色的线是我们不加任何噪声,practice cost 是正无穷,用我们的聚类中心来做的,可以看到在当 privacy cost 是 0.1 的时候,就是加的噪声相对比较大,但是性能已经比 baseline 高一些了。
2023-08-19 15:03:54 413
原创 联邦学习_王树森_视频整理
讲了并行算法或者叫做分布式算法。其中有一个编程模型叫做 parameter server,系统里面有一个或几个节点作为server,其他的节点作为worker。server 和 worker 之间可以通信,通信的方式叫做 message passing, server 可以给 worker 发消息, worker 可以给 server 发消息。我们可以用这种系统来训练,最小二乘回归也可以训练神经网络。
2023-07-12 09:18:29 374
原创 【deep_thoughts】48_快速复现PyTorch的Weight Normalization
pytorch官方API中的weight_norm是一个函数,而不是类。
2023-06-19 15:58:50 648
原创 torch.autograd.grad()详解
output为向量时,求解梯度时,需要将。output为标量时,不需要设置。这个式子中求出的一阶导是。,原因看上一篇博客。
2023-03-21 19:31:41 3830
原创 【deep_thoughts】11_PyTorch中如何进行向量微分、矩阵微分、计算雅各比行列式
pytorch中的autograd api,自用。
2023-03-08 14:51:49 678
原创 【deep_thoughts】55_PyTorch的交叉熵、信息熵、负对数似然、KL散度、余弦相似度的原理与代码
【deep_thoughts】55_PyTorch的交叉熵、信息熵、负对数似然、KL散度、余弦相似度的原理与代码
2023-02-17 01:26:42 1049
原创 【deep_thoughts】45_BatchNorm、LayerNorm、InstanceNorm、GroupNorm原理及pytorch手写实现API
备注:视频中使用的是3维[N,L,C]作为例子,本文以CV中常用的4维[N,C,H,W]进行改写举例。
2023-01-20 22:01:19 1111
原创 nn.Dropout、DropPath的理解与pytorch代码
在vit的代码中看到了DropPath,想知道DropPath与nn.Dropout()有什么区别,于是查阅相关资料记录一下。
2023-01-14 12:33:21 7763 3
原创 【deep_thoughts】30_PyTorch LSTM和LSTMP的原理及其手写复现
手写一个lstm_forward函数,实现LSTM的计算原理。个人使用。
2023-01-07 22:42:27 515 1
原创 【deep_thoughts】29_PyTorch RNN的原理及其手写复现
手写一个rnn_forward函数,实现RNN的计算原理。个人使用。
2023-01-05 15:04:20 457
原创 【pytorch】Transformer的Pytorch实现-简单翻译
使用Pytorch构建Transformer,采用了两对德语→英语翻译的句子,每个字的索引通过手动硬编码,降低代码阅读难度。构建编码器的输入、解码器的输入、解码器的输出即真实标签。
2022-11-23 18:15:46 955
转载 【廖雪峰】python_IO编程:StringIO和BytesIO、操作文件和目录、序列化
【廖雪峰】python_IO编程:StringIO和BytesIO、操作文件和目录、序列化
2022-10-08 09:50:58 606
转载 【廖雪峰】python面向对象高级编程:使用__slots__、使用@properety、多重继承、定制类、使用枚举类、使用元类
【廖雪峰】python面向对象高级编程:使用__slots__、使用@properety、多重继承、定制类、使用枚举类、使用元类
2022-10-07 13:50:32 396
转载 【廖雪峰】python高阶函数:map、reduce、filter、sorted
【廖雪峰】python高阶函数:map、reduce、filter、sorted
2022-10-05 16:14:42 140
原创 【图像处理】PIL与OpenCV的读取、显示、保存图片/ numpy与Image的转换
【图像处理】PIL与OpenCV的读取、显示、保存图片/ numpy与Image的转换
2022-10-03 10:49:34 1452
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人