Rocky Linux 8.4在Tesla P100服务器里的部署及显卡cudnn安装、miniconda安装-极度精简

安装Rocky linux教程

https://developer.aliyun.com/article/1074889

注意事项

  1. Tesla P100服务器,按Delete进入bios,设置Daul模式,第一选项选UEFI hard disk(用驱动盘选这个),usb的就选UEFI usb

  2. 安装rocky linux时,这两项默认,轻易不要改,否则可能无法安装下一步

在这里插入图片描述

生产环境安装(安装Nvidia驱动及cuda、cudnn等)

注意顺序:先按Nvidia,再安装cuda及cudnn,最后安装对应版本torch

Nvidia教程:https://blog.csdn.net/dendi_hust/article/details/111177699
cuda及nvidia对应关系:https://blog.csdn.net/qq_58611650/article/details/123450460
驱动下载:https://www.nvidia.cn/download/driverResults.aspx/207499/cn/
显卡及驱动信息查看:https://blog.csdn.net/m0_67403073/article/details/126749126
cuda及cudnn安装:https://blog.csdn.net/bluewind_1988/article/details/105244396
cuda及cudnn的关系:https://www.jianshu.com/p/622f47f94784
cuda与torch对应关系:https://blog.csdn.net/threestooegs/article/details/119531414
网卡配置参数含义:https://blog.csdn.net/z1014347942/article/details/78069966
静态IP设置:https://jingyan.baidu.com/article/9989c746d2161af649ecfe44.html
cuda及cudnn下载地址:https://blog.csdn.net/jhsignal/article/details/111401628
miniconda安装:https://zhuanlan.zhihu.com/p/685496400

运行

  1. 安装cuda
    在这里插入图片描述
  2. 安装cudnn
    在这里插入图片描述
  3. 安装miniconda
    bash Miniconda3-py38_23.11.0-1-Linux-x86_64.sh
    source ~/.bashrc
  4. conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  5. conda config --set show_channel_urls yes

注意事项

  1. 出现GPU驱动无法安装的时候,比如提示“Unable to find the kernel source tree for the currently running kernel.”系统没有kernel,有可能是系统没找到kernel,这时可以去/usr/src/kernels文件里看是否有内核文件,若有则执行安装NVIDIA时加上
    –kernel-source-path /usr/src/kernels/自己的内核就可以了,比如:
bash ./NVIDIA-Linux-x86_64-440.64.00.run  --kernel-source-path  /usr/src/kernels/自己的内核

不能解决看:https://blog.csdn.net/weixin_45606499/article/details/132302086

  1. 搜索自己的显卡版本时,需要注意有的驱动系列是在一起的,比如Tesla系列是和Data Center在一起
    在这里插入图片描述

  2. 设置静态ip时,如果重启服务提示:Unit network.service not found
    更换重启命令:‘systemctl restart NetworkManager’

  3. 安装nvidia出现如下错误“equires nvidia-kmod =”看网页:
    https://thelinuxcluster.com/tag/nvidia/

  4. 安装cuda出现如下错误“Install of driver component failed”:看:
    https://blog.csdn.net/bluewind_1988/article/details/105244396

  5. 安装好cuda,不提示nvcc可用,看:
    https://blog.csdn.net/weixin_44750512/article/details/123156020

安装conda

教程:https://blog.csdn.net/qq_44173974/article/details/125336916

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

河南-殷志强

希望我的文章能帮助到你

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值