1.pytorch与tensorrt
问题:pytorch -> onnx -> tensorrt
pytorch1.1转Onnx正常,且onnx TVM中可用,但是onnx转到tensorrt(6.1.)时生成的.trt model只有及k:
解决:版本问题,pytorch1.1转的onnx 与tensorrt6不兼容,pytorch升级到1.2解决,其它pytorch版本尚未验证。
2.horovod安装
先安装nccl与openmpi
版本问题:nccl 1.3.1会导致horovod安装失败,openmpi 2.4.8安装也未成功
最后成功版本:nccl 2.5.6, openmpi 4.0.0 ,horovod 0.19.0成功。
horovod安装:OROVOD_NCCL_HOME=/home/user/tools/nccl/build/(nccl包安装路径) HOROVOD_GPU_ALLREDUCE=NCCL pip install --no-cache-dir horovod