good_translation_is_wrong实验记录

Horovod的安装和使用
记录一下这两天配置NCCL和horovod的过程(原创)
服务器linux环境下horovod安装

#下载NCCL
nccl_2.1.15-1cuda9.1_x86_64
Ubuntu NCCL安装

#安装
tar xvf nccl_2.1.15-1+cuda9.1_x86_64.txz
mv nccl_2.1.15-1+cuda9.1_x86_64 /usr/local/nccl_2.1.15
#添加环境变量
vim ~/.bashrc
export LD_LIBRARY_PATH=/usr/local/nccl_2.1.15/lib:$LD_LIBRARY_PATH

openmpi-3.1.2
下载链接

#安装
(1)shell$ gunzip -c openmpi-4.1.3.tar.gz | tar xf -2)shell$ cd openmpi-4.1.33)shell$ ./configure --prefix=/usr/local
<...lots of output...>4)shell$ make all install
#查看是否安装成功
shell$ cd examples
shell$ make 
# shell$ mpicc -o hello_c hello_c.c
shell$  mpirun -np 4 hello_c

#我安装版本是4.0.1 因为3.1.2编译失败
wget https://download.open-mpi.org/release/open-mpi/v4.0/openmpi-4.0.1.tar.gz
tar zxvf openmpi-4.0.1.tar.gz
cd openmpi-4.0.1/
./configure --prefix=/usr/local
make all install

还需要安装Openmpi, gcc±5以上(horovod官网要求), tensorflow>=1.15.0

gcc --version
g++ --version
python --version
pip list | grep tensorflow
cat /usr/local/cuda/version.txt
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

#安装horovod
HOROVOD_NCCL_HOME=/usr/local/nccl_2.1.15/ HOROVOD_GPU_ALLREDUCE=NCCL HOROVOD_WITH_TENSORFLOW=1 pip install --no-cache-dir horovod==0.16(指定版本号,也可以不指定,默认最新的)
#测试horovod
python
import horovod.tensorflow
#修改配置文件,并重启
vim ~/.bashrc 
#vim /etc/profile

source /etc/profile
#这样升级更安全
pip install --upgrade tensorflow-gpu==1.15.5
#临时换下载源
pip install tensorflow-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple


#压缩 解压
tar -zcvf cmake-3.23.0-linux-x86_64.tar.gz
tar zxvf cudnn-9.0-linux-x64-v7.1.tgz -C good-translation-wrong-in-context/cudnn

#查看进程
ps aux 或 ps -elf 命令
#杀死进程
kill -9 进程ID
ps 进程号
#subword-nmt语言无关,不需要指定语言,en、de、ru等都可用,汉语好像也行。
subword-nmt learn-bpe -s 32000 < concatenated_en2de_train_en.txt  > bpe_rules.en
subword-nmt apply-bpe -c bpe_rules.en < concatenated_en2de_train_en.txt > out.txt

find -name
whereis cuda
which python
pip install -r requirements.txt
#修改 agt-get 镜像源 加快速度
sudo vim /etc/apt/sources.list

apt-get install 
apt update
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值