深度学习
文章平均质量分 60
乐乐灬小Y
我不懒,我不懒
展开
-
Anaconda添加安装tensorflow以及horovod
本文仅为个人记录使用 注意几个重要的点: 1、conda中创建环境要注意要安装的tensorflow对应的python版本(就比如目前的horovod支持的ensorflow最高为2.0.0,tesorflow2.0.0支持的python版本最高为3.7) 从源代码构建 | TensorFlowhttps://tensorflow.google.cn/install/source#gpu这个是官方的tensorflow对应python等相关环境的对应表 2、可以用如下操作配置一个专属的pyt..原创 2021-10-19 11:59:58 · 913 阅读 · 0 评论 -
基于智云星云服务器tensorflow的版本升级和Horovod安装与使用
智云星云服务器默认环境如下 tensorflow:1.14.0 tensorflow是否支持调用gpu:是 gcc:7.5.0 CUDA version:10.0.130 Driver Version:460.73.01 Cmake:无 CUDNN_VERSION:7.6.5.32 目前要配置horovod环境,查询资料可知,目前horovod只支持tensorflwo>=1.15的版本,因此要更新tensoflow版本,但是为了不破坏原本已经配好的环境,因此使用tensorfl.原创 2021-08-09 09:59:43 · 569 阅读 · 0 评论 -
报错:“AssertionError: Bad argument number for Name: 3, expecting 4“
记录一下问题的结决办法 环境: tensorflow:tensorflow-gpu1.14.0 horovod:0.19.5 python:3.7.9 CMake:3.21.1 是否安装了nccl:是 nccl版本:nccl_2.6.4-1+cuda10.0_x86_64 CUDA:CUDA10.0 CUDNN_VERSION=7.6.5.32 找到解决办法的地方:https://github.com/youdao-ai/SRNet/issues/4中ursaminor0401的回答 .原创 2021-08-05 09:58:09 · 359 阅读 · 0 评论 -
dlerror: libcuda rt.so.11.0: cannot open shared object file: No such file or directory的问题解决办法
全报错:dlerror: libcuda rt.so.11.0: cannot open shared object file: No such file or directory; LD_LIBRAR Y_PATH: /usr/local/cuda/lib64::/usr/local/nccl_2.10.3-1+cuda11.0_x86_64/lib 首先要在cuda安装的路径下面查看以下 cd /usr/local/cuda/lib64 查看是否有libcuda rt.so.11.0文件,以.原创 2021-08-03 14:24:58 · 4175 阅读 · 0 评论 -
ubuntu 配置 Horovod环境
最近在学习深度学习,导师叫我看看horovod,并自己配一下horovod的环境,看了网上很多很多的文章,自己也配了很多次,甚至把实验室的服务器给配崩了/(ㄒoㄒ)/~~。 得出了一个血一般的教训:主要看官方的文档,百度的教程只是作为辅助 Horovod官方GitHUb配置网站:https://github.com/horovod/horovod/blob/master/docs/install.rst Horovod官方gpu配置教程:https://github.com/horovod/horov原创 2021-08-03 14:08:35 · 1176 阅读 · 0 评论