conda换源安装torch+vscode分布式训练调试

conda换源安装torch(linux系统+anaconda)

1、找到.condarc文件
2、替换为一下内容:

channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud


3、conda info 命令查看目前使用的源
4、通过nvidia-smi查看自己电脑支持的cuda最高版本
5、conda search pytorch 查看目前可用conda 安装的pytorch版本,注意不仅查看版本号,还要看后面的release版本
6、安装pytorch GPU版本:conda install pytorch=1.12.1=gpu_cuda113py38h19ae3d8_1
7、以上方案可以直接在虚拟环境执行,不需要自己单独安装cuda与cudnn,但是还需要安装torchvision,同样conda search torchvision之后按照后面的release版本查看和自己cuda(113)相符合的版本,执行安装:conda install torchvision=0.13.1=py38_cu113
8、大工告成,这是目前尝试过最简单的安装方法。
9、以往我们安装的时候只注意版本号,比如1.12.1这些,但是一个版本号可能对应很多个release版本,直接安装往往不匹配,因此后面需要把release版本加上做一个限制。

vscode分布式训练调试

单卡训练往往好调试,那么多卡怎们办呢?很简单,在launch.json中修改:

{
    // Use IntelliSense to learn about possible attributes.
    // Hover to view descriptions of existing attributes.
    // For more information, visit: https://go.microsoft.com/fwlink/?linkid=830387
    "version": "0.2.0",
    "configurations": [
        {
            "name": "Python: 当前文件",
            "type": "python",
            "request": "launch",
            "program": "/home/{你自己的用户名}/.conda/envs/{虚拟环境名称}/lib/python3.7/site-packages/torch/distributed/launch.py",
            "console": "integratedTerminal",
            "args": [
                "--nproc_per_node=1",
                "fixmatch.py",
            ],
            "env": {"CUDA_VISIBLE_DEVICES":"0"},
        }
    ]
}

总的来说就是找到你目前虚拟环境中launch.py位置替换program以及将你执行的主文件替换fixmatch.py。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你可以按照以下步骤来安装condatorch、cuda和cudnn: 1. 首先,安装Anaconda或Miniconda,这是一个用于管理Python环境和软件包的工具。你可以从Anaconda官方网站(https://www.anaconda.com)下载适合你操作系统的版本,并按照官方文档的说明进行安装。 2. 安装CUDA(Compute Unified Device Architecture),这是一个用于利用NVIDIA GPU进行并行计算的平台。你可以从NVIDIA官方网站(https://developer.nvidia.com/cuda-downloads)下载适合你操作系统和GPU的CUDA版本,并按照官方文档的说明进行安装。 3. 安装cuDNN(CUDA Deep Neural Network library),这是NVIDIA提供的针对深度神经网络的加速库。你需要先注册一个NVIDIA开发者账号,然后从NVIDIA开发者网站(https://developer.nvidia.com/cudnn)下载适合你CUDA版本的cuDNN,并按照官方文档的说明进行安装。 4. 创建一个新的conda环境,并安装PyTorch。你可以使用以下命令创建一个名为"myenv"的新环境: ``` conda create --name myenv ``` 接下来,激活这个环境: ``` conda activate myenv ``` 然后,安装PyTorch和相应的CUDA版本,比如PyTorch 1.9.0: ``` conda install pytorch==1.9.0 torchvision torchaudio cudatoolkit=<your_cuda_version> -c pytorch ``` 记得将`<your_cuda_version>`替换为你安装的CUDA版本,比如`10.2`。 现在,你已经成功安装condatorch、cuda和cudnn,并创建了一个新的conda环境,其中包含了PyTorch和相关依赖。你可以在这个环境中进行深度学习任务了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值