自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(171)
  • 收藏
  • 关注

原创 使用Docker配置深度学习环境——以diffusers为例

Docker的其他信息可以在我的网站上找到,这里假设安装完成了,直接上手。把放到最前面。

2024-05-15 15:43:55 242

原创 【hugging face】使用纯代码管理仓库

创建和管理存储库Hugging Face Hub是一组 Git 存储库。Git是软件开发中广泛使用的工具,可以在协作工作时轻松对项目进行版本控制。主要有以下问题:创建和删除存储库管理分支和标签重命名您的存储库更新您的存储库可见性管理存储库的本地副本。

2024-04-18 08:59:20 918

原创 【Diffusers】DDIM的深入探索:API、代码、以及reverse DDIM

DDIM 及其反转

2024-04-17 21:23:22 495

原创 【debug】复现老代码,遇到tensorboard的api改变

最近在复现各种代码时候,遇到了版本不匹配问题。每次新建环境太久了,就开始改代码。这里总结一下有哪些点可以改。从 TensorFlow 1 到 TensorFlow 2 迁移时,TensorBoard 的使用方式也发生了一些变化。这主要是因为 TensorFlow 2 强调更简单和更直观的 API,以及默认启用的 Eager Execution 模式。

2024-04-15 20:34:16 316

原创 pytorch中通道数不一样怎么办?

在深度学习中,1x1卷积(有时也称为点卷积)是一种有效的技术,常用于改变卷积神经网络中特征图的通道数。这种方法可以在不改变特征图空间维度(高度和宽度)的情况下,调整其深度(通道数),从而实现特征图的通道数对齐。除此之外,1x1卷积还可以用于实现网络中的参数降维和增维,以及在某些情况下替代全连接层。

2024-04-11 20:10:10 570

原创 检查模型的输入输出尺寸以及模型内部各层的尺寸

在PyTorch中,了解和检查模型的输入输出尺寸以及模型内部各层的尺寸对于调试和优化模型极其重要。这可以帮助你确保数据在模型中正确流动,并及时发现尺寸不匹配等问题。

2024-04-11 20:06:01 463

原创 如何将数据(通常是张量)和模型转移到CUDA设备(即GPU)上

在PyTorch中,将模型和数据移到GPU上进行加速计算是深度学习训练过程中的一个常见步骤。这里将介绍如何将数据(通常是张量)和模型转移到CUDA设备(即GPU)上。

2024-04-11 20:02:56 922

原创 【debug】在colab、kaggle上传hugging face的datasets、models失败

重启kernal:点击。

2024-03-28 17:19:01 205

原创 【DiT 】推理代码

根据尺寸自动下载模型。

2024-03-27 15:25:48 263

原创 【确保ssh中断后程序运行】使用tmux保护ssh运行的程序

tmuxtmux。

2024-03-26 14:32:14 355

原创 【小工具】一键美化nvidia-smi,查看GPU运行状态,无须配置

可以在远程console看,是动态的。鼠标滚轮控制显示哪个进程。

2024-03-14 10:56:06 382

原创 【CUDA】获取当前显存状态的多种方式:准确性与原理讨论

显存状态的获取对于深度学习任务至关重要,特别是在使用 GPU 进行模型训练和推理时。了解当前显存的使用情况可以帮助我们优化算法、调整超参数,以及有效地管理计算资源。在本文中,我们将讨论多种获取当前显存状态的方法,并探讨它们的准确性和原理。

2024-03-12 09:46:34 1319

原创 常用 的 预训练权重格式 safetensor、ckpt、LoRA

检查点成功转换后,您将看到包含转换后的检查点的新存储库的链接。点击新存储库的链接,您将看到 Convert KerasCV Space 生成了一个带有推理小部件的模型卡,用于尝试转换后的模型。根据模型的训练方式,您不一定需要提供 UNet 和文本编码器的路径。在开始之前,请确保您有 Diffusers 的本地克隆来运行脚本并登录到您的 Hugging Face 帐户,以便您可以打开拉取请求并将转换后的模型推送到 Hub。转换这些格式以在 Diffusers 中使用,可以让您使用该库支持的所有功能,例如**

2024-03-07 10:16:02 1032

原创 【Diffusers】三、扩散模型的训练流程

通常,最好的结果是通过在特定数据集上微调预训练模型来获得的。,以生成自己的 🦋 蝴蝶 🦋。

2024-03-07 10:07:29 1289

原创 【Diffusers教程】二、Diffusers 的 pipeline,利用同一个模型完成不同模态任务

对于某些工作流程或者如果您要加载许多管道,从检查点重用相同的组件会更节省内存,而不是重新加载它们,这会不必要地消耗额外的内存。如果您想更改新管道的行为,您可以覆盖原始管道中的任何参数甚至配置。**方法检测原始管道类并将其映射到与您想要执行的任务相对应的新管道类。如果对库和扩散模型不熟悉,可能很难知道要使用哪个管道来完成任务。此方法从先前加载的管道的组件创建新管道,无需额外的内存成本。**您还可以传递特定于管道类的任何其他参数,例如。,并会在幕后加载相应的**如果您想进行修复,则**同样,对于图像到图像,

2024-03-07 09:32:39 513

原创 【Diffusers教程】一、简介:快速使用Diffusion网络

原始教程地址: https://huggingface.co/docs/diffusers/using-diffusers/write_own_pipeline。

2024-03-06 20:53:02 2183 2

原创 【低显存】 diffusion 爆显存的解决方法

降低diffusion显存占用的四个方法

2024-03-06 20:49:40 954

原创 【debug】OSError: Can‘t load tokenizer for ‘XXX‘. If you were trying to load it from ‘https://huggingf

本地目录与 ‘openai/clip-vit-large-patch14’ 同名:如果你的本地目录中有一个名为 ‘openai/clip-vit-large-patch14’ 的文件夹,可能会导致加载错误。请检查你的工作目录或者其他相关目录中是否有同名文件夹,并确保没有命名冲突。模型路径错误:确保 ‘openai/clip-vit-large-patch14’ 是正确的模型路径,可以尝试重新确认模型路径是否正确。

2024-03-06 14:56:14 2864

原创 ldm 的pip错误安装问题

基于diffsion的很多工作需要使用ldm库,但是部分仓库的教程没有写明是哪个ldm。

2024-03-06 11:05:36 602

原创 Pytorch安装遇到网络问题

conda在运行出现问题。

2024-02-22 17:26:45 483

原创 【debug】Pytorch环境冲突

创建一个新的conda环境:如果在当前环境中解决冲突比较困难,考虑创建一个新的conda环境,并在这个新环境中安装需要的包,可以有效避免版本冲突。统一环境中的PyTorch版本:确保pytorch、torchvision和torchaudio都是兼容同一版本的PyTorch。因为torchaudio和torchvision指定了需要特定版本的pytorch,而cudatoolkit又指定了需要特定版本的vs2015_runtime。1.10.1,所以在这一点上它们是兼容的。

2024-02-22 16:07:29 597 1

原创 【论文阅读】**Cross-Modality depth Estimation via Unsupervised Stereo RGB-to-infrared Translation**

深度估计是许多计算机视觉应用的一项基本任务[1]、[2]、[3]。随着CNN的发展,许多算法进一步提高了深度估计的性能。主流方法是从立体图像估计场景深度。根据训练方式的不同,监督方法[4]、[5]、[6]使用真实视差图直接指导训练,而无监督方法[7]、[8]、[9]将深度估计重新表述为利用立体关系作为监督来辅助训练的图像重建问题。一般来说,大多数现有方法[ 4,5,6,10,11,7,8,9,12,13 ]仅使用可见光(RGB )图像进行估计。

2024-02-22 15:43:26 865

原创 AttributeError: module ‘configparser‘ has no attribute ‘SafeConfigParser‘. Did you mean: ‘RawConfigP

在pip安装时,出现bug。

2024-02-22 15:20:45 1296

原创 【debug】source ~/.bashrc HOME: command not found

一般是路径的公式写错了,使用绝对路径解决。

2024-02-18 16:31:20 335

原创 【NCCL】入门(一):介绍和简单demo

NCCL(NVIDIA Collective Communications Library)是由NVIDIA开发的一种用于高性能GPU集群的通信库。它旨在提供高效的GPU间通信和协作能力,以加速分布式深度学习和其他GPU密集型计算任务。NCCL支持在多个GPU之间进行并行计算和通信。它可以在多个GPU之间实现高效的数据传输和同步,以利用集群中的所有GPU资源。被广泛用于分布式深度学习训练中,特别是在使用多个GPU进行模型训练时。它提供了一致的接口和通信原语,使不同GPU之间的数据交换和同步变得简单和高效。

2024-02-16 23:25:06 983

原创 【跟踪】Windows运行PyTracking

2024年,安装tracking的更改之处

2024-01-29 13:34:38 435

原创 【WebGPU】简介和开始

WebGPU 是一种 API,用于在 Web 应用中访问 GPU 的功能。在 WebGPU 出现之前,有一个 WebGL,它提供了 WebGPU 的部分功能。它开创了一种新的富媒体 Web 内容类别,并且开发者也利用它构建了许多精彩的内容。不过,它基于 2007 年发布的 OpenGL ES 2.0 API,而该 API 基于更旧的 OpenGL API。在那段时间里,GPU 取得了显著进步,用来与 GPU 进行交互的原生 API 也在与 Direct3D 12、Metal 和 Vulkan 一起发展。

2024-01-27 20:30:20 1072 1

原创 【cuda】RuntimeError: Unexpected error from cudaGetDeviceCount()

会发现 nvidia-smi 不管用了。不要立即重启,会黑屏的。赶紧记录使用的驱动版本号,最好找到安装包位置。直接重装原版驱动,环境还能用。参考我的安装博客。已经黑屏就进入安全模式,network模式。卸载可视化桌面和显卡驱动。驱动程序已经更新,可以尝试回滚到之前的版本。

2024-01-25 20:52:36 798

原创 【pysot 深入理解】 一、demo.py

pysot包。

2024-01-25 20:13:25 372

翻译 【申请指南】开源项目:Google Summer of Code 2024

作为导师组织参与 GSoC 的开源项目涵盖许多领域,包括在 AI/ML、安全、云、开发工具、科学、医学、数据、媒体等领域从事有趣工作的项目!我们还鼓励您查看导师指南、我们的“ Google Summer of Code 简介”视频,以及我们关于为何开源项目很高兴成为 GSoC 计划一部分的短视频。访问该计划网站并阅读导师指南,了解成为导师组织意味着什么以及如何准备你的社区(提示:拥有大量兴奋、专注的导师和深思熟虑的项目想法!GSoC 的目标是将新的贡献者带入已建立的、受欢迎的社区。

2024-01-25 20:10:42 414

原创 【一次性解决】深入理解CUDA和PyTorch的安装与多版本管理的三种方式

系统环境变量很多人配置环境就是直接安装三件套,而对于版本管理不是很清楚。在开发初期,这样做没什么问题。但是如果服务器多人使用,或者复现代码多(pytorch版本和cuda版本是互相依赖的),就需要更进一步的版本管理方法。这里将详细介绍用于深度学习或者CPP开发的CUDA版本管理方式。在配置环境前,首先需要明确自己的需求。对于使用Python进行的开发,推荐在。对于C++开发,只使用手动管理版本即可,无须安装anaconda和docker。请注意,以下的方法选择其一即可,混着用容易把自己搞乱了。

2024-01-25 20:09:07 1429

原创 【debug】dpkg: error processing package initramfs-tools (--configure):

参考https://askubuntu.com/questions/1136480/initramfs-error-when-installing-updating报错sudo apt autoremove 报错。

2024-01-23 09:30:01 728

原创 【Poetry】python包管理工具简介

Poetry是一个Python的依赖管理和打包工具,它旨在简化包管理和项目构建的流程。与pip和virtualenv的组合相比,Poetry提供了更一体化的解决方案,可以更好地处理依赖关系和项目的配置。Poetry为Python项目提供了一个全面的包管理解决方案,特别适合于需要处理复杂依赖的项目。通过简化依赖管理、项目配置和打包流程。

2024-01-22 16:21:31 516

原创 【linux】Xorg的工作原理

在linux系统上执行nvidia-smi时,总有一个进程占用gpu。是与X Window System(简称X11或X)相关的一个应用程序。X Window System是一个在类Unix操作系统上广泛使用的图形界面系统。它提供了基础的图形界面功能,允许在用户和操作系统之间展示图形界面。具体来说,Xorg 是X Window System的一个开源实现,通常用于管理和协调显示设备(如显示器)、输入设备(如鼠标和键盘)以及图形卡之间的交互。

2024-01-22 15:07:02 930

原创 【git】解决网络连接问题

的上游分支指向远程仓库中的相应分支。但如果您在本地创建了一个新的分支并希望推送到远程仓库,Git 需要知道这个本地分支应该关联到远程仓库中的哪个分支。在没有明确指定的情况下,Git 不会自动假设或创建一个远程分支,因此会显示这个错误,提示您需要明确设置上游分支。分支)没有设置追踪的上游(upstream)分支。在 Git 中,上游分支是远程仓库中与本地分支相对应的分支,用于跟踪本地和远程之间的差异。尝试推送(push)到远程仓库时,Git 发现当前的分支(在这个案例中是 master。

2024-01-18 20:52:23 658

原创 【pytorch】手写backward

在 PyTorch 中,仿射变换不是直接应用于原始图像张量的,而是应用于一个网络的一部分,这样可以在训练过程中通过自动微分机制实现反向传播。xy是原始图像中的像素坐标,x′y′是变换后的坐标,abcd是旋转和缩放矩阵的元素,tx​ty​是平移的距离。在训练神经网络时,你需要计算损失函数相对于网络参数的梯度,然后用这个梯度来更新参数。这通过反向传播算法实现,PyTorch 的 autograd 系统自动帮你计算这些梯度。

2024-01-17 21:12:53 419

原创 【cuda】六、基础库:cuBLAS入门

CUDA(BLAS)提供了高效计算线性代数的方法。有三级API

2024-01-16 20:30:44 1478

原创 【CUDA】零基础入门教程合集

使用vs分析性能:https://blog.csdn.net/prinTao/article/details/135619840?

2024-01-16 11:47:42 549

原创 【CUDA】五、基础概念:Coalescing合并用于内存优化

coalescing writes”(合并写操作)是一种优化内存访问模式的技术,它能显著提高内存带宽的利用效率。在行主序排列中,多维数组的行元素是连续存储的。:在行主序排列中,数组的每一行元素在内存中是连续存储的。这意味着如果你有一个二维数组,数组中的第一行的所有元素在内存中是连续的。函数用于分配二维数组,同时确保每行数据在内存中是对齐的,这对于优化二维数据的内存访问效率非常关键。是第二行的所有元素,依此类推。关键字是特定于NVIDIA的编译器扩展,用于指定变量或结构体在内存中的对齐方式。

2024-01-16 11:38:05 437

原创 【cuda】Visual Studio中进行CUDA程序的性能评估

对特定的函数、内存操作或其他CUDA活动进行深入分析。

2024-01-16 11:10:27 765

倒立摆仿真、起摆代码和仿真

倒立摆仿真、起摆代码和仿真

2023-12-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除