- 博客(1141)
- 资源 (42)
- 收藏
- 关注
原创 ControlNet
标题:Adding Conditional Control to Text-to-Image Diffusion Models作者:Lvmin Zhang, Maneesh Agrawala原文链接:https://arxiv.org/pdf/2302.05543.pdf代码链接:https://github.com/lllyasviel/ControlNet大型文本到图像模型的存在让人们意识到人工智能的巨大潜力,这些模型可以通过用户输入简短的描述性提示来生成视觉上吸引人的图像。
2024-07-10 11:46:17 778
转载 MAE -Masked Autoencoders Are Scalable Vision Learners
本文表明,掩码自编码器 (MAE) 是用于计算机视觉的可扩展自监督学习器。本文的 MAE 方法很简单:屏蔽输入图像的随机patch 并重建丢失的像素。它基于两个核心设计。首先,本文开发了一个非对称的 编码器-解码器架构,其中一个编码器 只对 可见的patches子集(没有掩码tokens)进行操作,以及一个轻量级解码器,它从隐表示 和 掩码tokens 重建原始图像。其次,本文发现 屏蔽输入图像的高比例,例如 75%,会产生一个重要且有意义的自监督任务。结合这两种设计使本文能够有效地训练大型模型:本文
2024-07-08 17:11:08 49
转载 NT-Xent (Normalized Temperature-Scaled Cross-Entropy) Loss Explained and Implemented in PyTorch
loss
2024-07-08 16:47:08 114
原创 计算机视觉 自监督学习 资料
https://zhuanlan.zhihu.com/p/258958247https://zhuanlan.zhihu.com/p/682212621
2024-07-08 16:45:25 119
原创 LLM 资料
从 FlashAttention 到 PagedAttention, 如何进一步优化 Attention 性能 Transformer综述!100多种不同的视觉Transformer
2024-07-08 15:27:59 108
原创 Bert 变种, T5模型
NLP-预训练模型-2019-NLU:DistilBERT【 BERT模型压缩】【模型大小减小了40%(66M),推断速度提升了60%,但性能只降低了约3%】_distillbert-CSDN博客https://zhuanlan.zhihu.com/p/673535548
2024-07-08 14:23:15 339
原创 EINSUM IS ALL YOU NEED
Tim Rocktäschelhttps://medium.com/ibm-data-ai/einsum-an-easy-intuitive-way-to-write-tensor-operation-9e12b8a80570Understanding einsum for Deep learning: implement a transformer with multi-head self-attention from scratch | AI Summer
2024-07-07 19:07:06 125
原创 全模态自监督算法—data2vec
https://zhuanlan.zhihu.com/p/471494010Data2Vec:视觉、语音和语言的语境化目标表征的高效自监督学习_data2vec模型-CSDN博客
2024-07-02 11:43:21 107
原创 How does vmap() function work?
According to JAX docsfile on vmap, jax.vmap(function, in_axes=0, out_axes=0) returns a function which maps the function one specified over using in_axes and stack them together using out_axes
2024-06-04 11:44:32 644
原创 Multiprocessing Freeze Support in Python
You can add support for multiprocessing when freezing your code via the multiprocessing.freeze_support() function.In this tutorial you will discover how to add freeze support for multiprocessing in your Python program.You can package your code with a Pytho
2024-04-17 10:38:29 1258
转载 NVIDIA MPS总结
MPS多进程服务(Multi-Process Scheduling)是CUDA应用程序编程接口(API)的替代二进制兼容实现。从Kepler的GP10架构开始,NVIDIA就引入了MPS(基于软件的多进程服务),这种技术在当时实际上是称为HyperQ ,允许多个 流(stream)或者CPU的进程同时向GPU发射Kernel函数,结合为一个单一应用程序的上下文在GPU上运行,从而实现更好的GPU利用率。在单个进程的任务处理,对GPU利用率不高的情况下是非常有用的。
2024-02-06 10:02:34 409
转载 Facebook如何训练超大模型系列
我们在前文介绍过,微软 ZeRO 可以对一个万亿参数模型可以使用 8 路模型并行、64 路管道并行和 8 路数据并行在 4,096 个 NVIDIA A100 GPU 上进行扩展。而FSDP(Fully Sharded Data Parallel)是Facebook 深度借鉴微软ZeRO之后提出的PyTorch DDP升级版本,可以认为是对标微软 ZeRO,其本质是 parameter sharding。Parameter sharding 就是把模型参数等切分到各个GPU之上。
2023-06-21 15:31:24 396
转载 大模型训练框架Megatron原理系列转载
NVIDIA Megatron 是一个基于 PyTorch 的分布式训练框架,用来训练超大Transformer语言模型,其通过综合应用了数据并行,Tensor并行和Pipeline并行来复现 GPT3,值得我们深入分析其背后机理。本系列大概有6~7篇文章,通过论文和源码和大家一起学习研究。本文把 Megatron 的两篇论文/一篇官方PPT 选取部分内容,糅合在一起进行翻译分析,希望大家可以通过本文对 Megatron 思路有一个基本了解。
2023-06-20 11:34:03 3962
原创 linkname, soname and realname
As you may already know, the linker1 option should be used to specify the name of the library which is needed by your application when it was compiled. For example, if we write a program which utilize libjpeg, we should specify explicitly when we compile
2023-05-22 13:26:11 596
原创 通过例子深入了解c++/c的构建系统
C/C++ is the mother of many popular programming languages out there today, all the fancy programming languages we use today like Python, JavaScript are built using C/C++. For example, the standard python interpreter is built using C and the most popular J
2023-04-25 13:37:04 1743 4
原创 PixelShuffle上采样原理
PixelShuffle是目前通用上采样upsample技术中性能最好的。PixelShuffle现已广泛应用在如图像分割等计算机视觉问题上,和。一起成为了神经网络中最常用的两种上采样技术。
2023-04-12 11:36:45 162
原创 @contextmanager 和yield 的结合使用法
上面这个例子,我们可以把print('1') 和 print('3')看成是try和except,要执行代码的部分就是他们中间的部分,进行以下更改。先执行commit(),遇到yield后,跳出来执行sql1,sql2,然后再进入commit()执行上一次跳出来的位置。所以要引用装饰器@contextmanager,它需要与with语法结合使用。但是每次都这样try...except...就会显得很重复。
2023-04-06 17:45:34 297
原创 Understanding Diffusion Probabilistic Models (DPMs) 扩散模型,最好资料
diffusion model step by step
2023-03-28 17:59:32 960 1
Pro Go The Complete Guide -go语言学习最新书籍
2023-06-19
Advanced_Programming_in_the_UNIX_Environment,_3rd
2018-11-30
Deep_Learning_Quick_Reference
2018-09-01
Convex Optimization Algorithms
2018-09-01
Guide.to.Medical.Image.Analysis.Methods.and.Algorithms
2018-09-01
Python Machine Learning Machine Learning and Deep Learning
2018-03-27
Data Structures and Algorithms Using Python and C++
2018-03-27
R_for_Data_Science
2018-03-27
Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow
2018-03-17
Approximate.Dynamic.Programming.2011
2018-01-17
Swarm Intelligence Principles Advances and Applications
2018-01-13
Reinforcement Learning With Open A TensorFlow and Keras Using Python.pdf
2017-12-18
Fundamentals of Deep Learning完整非扫描版本2017
2017-12-16
Text Mining in Practice with R 2017.12
2017-12-13
Text_Mining-From_Ontology_Learning_to_Automated_Text_Processing_Applications
2017-12-13
Tensorflow 机器学习参考手册2007
2017-11-22
Spark大数据处理技术 带标签 完整版
2017-11-12
模式分类11
2016-11-07
集体编程智慧
2016-11-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人