prinTao-CSDN博客

原创使用Docker配置深度学习环境——以diffusers为例

Docker的其他信息可以在我的网站上找到，这里假设安装完成了，直接上手。把放到最前面。

2024-05-15 15:43:55 242

原创【hugging face】使用纯代码管理仓库

创建和管理存储库Hugging Face Hub是一组 Git 存储库。Git是软件开发中广泛使用的工具，可以在协作工作时轻松对项目进行版本控制。主要有以下问题：创建和删除存储库管理分支和标签重命名您的存储库更新您的存储库可见性管理存储库的本地副本。

2024-04-18 08:59:20 918

原创【Diffusers】DDIM的深入探索：API、代码、以及reverse DDIM

DDIM 及其反转

2024-04-17 21:23:22 495

原创【debug】复现老代码，遇到tensorboard的api改变

最近在复现各种代码时候，遇到了版本不匹配问题。每次新建环境太久了，就开始改代码。这里总结一下有哪些点可以改。从 TensorFlow 1 到 TensorFlow 2 迁移时，TensorBoard 的使用方式也发生了一些变化。这主要是因为 TensorFlow 2 强调更简单和更直观的 API，以及默认启用的 Eager Execution 模式。

2024-04-15 20:34:16 316

原创 pytorch中通道数不一样怎么办？

在深度学习中，1x1卷积（有时也称为点卷积）是一种有效的技术，常用于改变卷积神经网络中特征图的通道数。这种方法可以在不改变特征图空间维度（高度和宽度）的情况下，调整其深度（通道数），从而实现特征图的通道数对齐。除此之外，1x1卷积还可以用于实现网络中的参数降维和增维，以及在某些情况下替代全连接层。

2024-04-11 20:10:10 570

原创检查模型的输入输出尺寸以及模型内部各层的尺寸

在PyTorch中，了解和检查模型的输入输出尺寸以及模型内部各层的尺寸对于调试和优化模型极其重要。这可以帮助你确保数据在模型中正确流动，并及时发现尺寸不匹配等问题。

2024-04-11 20:06:01 463

原创如何将数据（通常是张量）和模型转移到CUDA设备（即GPU）上

在PyTorch中，将模型和数据移到GPU上进行加速计算是深度学习训练过程中的一个常见步骤。这里将介绍如何将数据（通常是张量）和模型转移到CUDA设备（即GPU）上。

2024-04-11 20:02:56 922

原创【debug】在colab、kaggle上传hugging face的datasets、models失败

重启kernal：点击。

2024-03-28 17:19:01 205

原创【确保ssh中断后程序运行】使用tmux保护ssh运行的程序

tmuxtmux。

2024-03-26 14:32:14 355

原创【小工具】一键美化nvidia-smi，查看GPU运行状态，无须配置

可以在远程console看，是动态的。鼠标滚轮控制显示哪个进程。

2024-03-14 10:56:06 382

原创【CUDA】获取当前显存状态的多种方式：准确性与原理讨论

显存状态的获取对于深度学习任务至关重要，特别是在使用 GPU 进行模型训练和推理时。了解当前显存的使用情况可以帮助我们优化算法、调整超参数，以及有效地管理计算资源。在本文中，我们将讨论多种获取当前显存状态的方法，并探讨它们的准确性和原理。

2024-03-12 09:46:34 1319

原创常用的预训练权重格式 safetensor、ckpt、LoRA

检查点成功转换后，您将看到包含转换后的检查点的新存储库的链接。点击新存储库的链接，您将看到 Convert KerasCV Space 生成了一个带有推理小部件的模型卡，用于尝试转换后的模型。根据模型的训练方式，您不一定需要提供 UNet 和文本编码器的路径。在开始之前，请确保您有 Diffusers 的本地克隆来运行脚本并登录到您的 Hugging Face 帐户，以便您可以打开拉取请求并将转换后的模型推送到 Hub。转换这些格式以在 Diffusers 中使用，可以让您使用该库支持的所有功能，例如**

2024-03-07 10:16:02 1032

原创【Diffusers】三、扩散模型的训练流程

通常，最好的结果是通过在特定数据集上微调预训练模型来获得的。，以生成自己的 🦋 蝴蝶 🦋。

2024-03-07 10:07:29 1289

原创【Diffusers教程】二、Diffusers 的 pipeline，利用同一个模型完成不同模态任务

对于某些工作流程或者如果您要加载许多管道，从检查点重用相同的组件会更节省内存，而不是重新加载它们，这会不必要地消耗额外的内存。如果您想更改新管道的行为，您可以覆盖原始管道中的任何参数甚至配置。**方法检测原始管道类并将其映射到与您想要执行的任务相对应的新管道类。如果对库和扩散模型不熟悉，可能很难知道要使用哪个管道来完成任务。此方法从先前加载的管道的组件创建新管道，无需额外的内存成本。**您还可以传递特定于管道类的任何其他参数，例如。，并会在幕后加载相应的**如果您想进行修复，则**同样，对于图像到图像，

2024-03-07 09:32:39 513

原创【Diffusers教程】一、简介：快速使用Diffusion网络

原始教程地址： https://huggingface.co/docs/diffusers/using-diffusers/write_own_pipeline。

2024-03-06 20:53:02 2183 2

原创【低显存】 diffusion 爆显存的解决方法

降低diffusion显存占用的四个方法

2024-03-06 20:49:40 954

原创【debug】OSError: Can‘t load tokenizer for ‘XXX‘. If you were trying to load it from ‘https://huggingf

本地目录与 ‘openai/clip-vit-large-patch14’ 同名：如果你的本地目录中有一个名为 ‘openai/clip-vit-large-patch14’ 的文件夹，可能会导致加载错误。请检查你的工作目录或者其他相关目录中是否有同名文件夹，并确保没有命名冲突。模型路径错误：确保 ‘openai/clip-vit-large-patch14’ 是正确的模型路径，可以尝试重新确认模型路径是否正确。

2024-03-06 14:56:14 2864

原创 ldm 的pip错误安装问题

基于diffsion的很多工作需要使用ldm库，但是部分仓库的教程没有写明是哪个ldm。

2024-03-06 11:05:36 602

原创 Pytorch安装遇到网络问题

conda在运行出现问题。

2024-02-22 17:26:45 483

原创【debug】Pytorch环境冲突

创建一个新的conda环境：如果在当前环境中解决冲突比较困难，考虑创建一个新的conda环境，并在这个新环境中安装需要的包，可以有效避免版本冲突。统一环境中的PyTorch版本：确保pytorch、torchvision和torchaudio都是兼容同一版本的PyTorch。因为torchaudio和torchvision指定了需要特定版本的pytorch，而cudatoolkit又指定了需要特定版本的vs2015_runtime。1.10.1，所以在这一点上它们是兼容的。

2024-02-22 16:07:29 597 1

原创【论文阅读】Cross-Modality depth Estimation via Unsupervised Stereo RGB-to-infrared Translation

深度估计是许多计算机视觉应用的一项基本任务[1]、[2]、[3]。随着CNN的发展，许多算法进一步提高了深度估计的性能。主流方法是从立体图像估计场景深度。根据训练方式的不同，监督方法[4]、[5]、[6]使用真实视差图直接指导训练，而无监督方法[7]、[8]、[9]将深度估计重新表述为利用立体关系作为监督来辅助训练的图像重建问题。一般来说，大多数现有方法[ 4,5,6,10,11,7,8,9,12,13 ]仅使用可见光（RGB ）图像进行估计。

2024-02-22 15:43:26 865

原创 AttributeError: module ‘configparser‘ has no attribute ‘SafeConfigParser‘. Did you mean: ‘RawConfigP

在pip安装时，出现bug。

2024-02-22 15:20:45 1296

原创【debug】source ~/.bashrc HOME: command not found

一般是路径的公式写错了，使用绝对路径解决。

2024-02-18 16:31:20 335

原创【NCCL】入门（一）：介绍和简单demo

NCCL（NVIDIA Collective Communications Library）是由NVIDIA开发的一种用于高性能GPU集群的通信库。它旨在提供高效的GPU间通信和协作能力，以加速分布式深度学习和其他GPU密集型计算任务。NCCL支持在多个GPU之间进行并行计算和通信。它可以在多个GPU之间实现高效的数据传输和同步，以利用集群中的所有GPU资源。被广泛用于分布式深度学习训练中，特别是在使用多个GPU进行模型训练时。它提供了一致的接口和通信原语，使不同GPU之间的数据交换和同步变得简单和高效。

2024-02-16 23:25:06 983

原创【跟踪】Windows运行PyTracking

2024年，安装tracking的更改之处

2024-01-29 13:34:38 435

原创【WebGPU】简介和开始

WebGPU 是一种 API，用于在 Web 应用中访问 GPU 的功能。在 WebGPU 出现之前，有一个 WebGL，它提供了 WebGPU 的部分功能。它开创了一种新的富媒体 Web 内容类别，并且开发者也利用它构建了许多精彩的内容。不过，它基于 2007 年发布的 OpenGL ES 2.0 API，而该 API 基于更旧的 OpenGL API。在那段时间里，GPU 取得了显著进步，用来与 GPU 进行交互的原生 API 也在与 Direct3D 12、Metal 和 Vulkan 一起发展。

2024-01-27 20:30:20 1072 1

倒立摆仿真、起摆代码和仿真

空空如也