![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
tools
zxx_id
我是菜鸟,但不是送快递的。。。
展开
-
horovod>error>horovod使用过程中的报错总结
1 运行horovod案例examples中的pytorch_mnist.py 时,执行命令10.211.55.4是目标主机ip,因为只有一个cpu能用,所以-np 1,当使用localhost时就不会有这个异常horovodrun -np 1 -H 10.211.55.4:1 python pytorch_mnist.py报错如下…bash: orted: command not found--------------------------------------------------原创 2021-01-28 10:58:44 · 1406 阅读 · 0 评论 -
ccache>install>ubuntu安装ccache
在安装horovod的时候报错:没有发现ccache,这里记录下安装方法…1 下载3.6版本的ccache安装包也可以下载需要的版本网址https://www.samba.org//ftp/ccache/wget https://www.samba.org//ftp/ccache/ccache-3.6.tar.xz2 解压,并进入到该目录tar -xvf ccache-3.6.tar.xz cd ccache-3.63 配置安装路径我一般都选择安装在 /usr/local/原创 2021-01-28 09:17:43 · 1022 阅读 · 1 评论 -
gcc/g++>install>ubuntu安装gcc/g++
在使用编译环境的时候gcc/g++都是必须的(敝人不太懂这方面的东西,总之先记录下来)添加apt源sudo vim /etc/apt/sources.listdeb http://dk.archive.ubuntu.com/ubuntu/ xenial maindeb http://dk.archive.ubuntu.com/ubuntu/ xenial universesudo apt updateapt安装sudo apt-get install gccsudo apt-get原创 2021-01-26 15:26:06 · 334 阅读 · 0 评论 -
horovod>install>ubuntu安装horovod
之前做tensorflow分布式训练的时候,使用tensorflow的原装方法,真的是折腾了将近三周,最近在做pytorch的分布式训练接触到了horovod,暂时没有使用pytorch的原装方法,貌似horovod也可以做tensorflow的分布式训练,下载尝试一下,不管成功与否,记录一下部署过程一、安装依赖环境1 安装mpi2 安装nccl2二、安装horovod1 直接使用pip安装pip install horovod报错1:cmake:command not found解决:原创 2021-01-26 15:15:41 · 462 阅读 · 0 评论 -
cmake>install>ubuntu安装cmake
恕敝人愚昧,不知道make和cmake是神马关系系统:ubuntu18.04版本:3.19.3(目前最新)1 官网下载最新版本的安装包我这下载的linux3.19.3(我这超级慢)cmake-3.19.3.tar.gz2 解压tar -zxvf cmake-3.19.3.tar.gz3 编译./bootstrapmakemake install如果没有报错,那应该就是完成了…...原创 2021-01-26 14:49:00 · 298 阅读 · 0 评论 -
nccl>install>ubuntu安装nccl
nccl是我在安装horovod的时候需要安装的一个依赖,这里单独拿出来写一下方法一:(我失败了)1 从github上获取编译包,并进入该文件夹git clone https://github.com/NVIDIA/ncclcd nccl2 编译make -j8(这一步报错了)sudo make install方法二:1 下载NVIDIA官网安装文件(需要验证,超级慢,而且下载的都是32b的文件,应该是有问题)nvidia-machine-learning-repo-ubuntu18原创 2021-01-26 14:22:56 · 736 阅读 · 1 评论 -
markdown>skill>markdown的一些使用技巧
开始使用CSDN的markdown编辑器写博客,有些功能还不会用,搜一搜、查一查、记一记,持续更新,大家可以参考一下一、特殊符号1 空格半方大的空白 或 全方大的空白 或 不断行的空白格 或 注意有个 ; 号...原创 2021-01-26 12:38:07 · 105 阅读 · 0 评论