CUDA
粼粼淇
淇水汤汤,波光粼粼。岸芷汀兰,郁郁青青。
从事计算机视觉,机器学习等方面算法的工作,爱好数学、算法、编程、中国古典文学、哲学,喜欢旅游,爱思考、爱推理;追求卓越、追求极致。
展开
-
fatal error :cudnn_version.h:No such file or directory
fatal error :cudnn_version.h:No such file or directory原创 2022-11-09 21:41:44 · 1609 阅读 · 0 评论 -
pytorch 使用多GPU训练模型测试出现:TypeError: forward() missing 1 required positional argument: ‘x‘可能解决方法
最近在使用u版yolov3训练数据集时,使用多GPU训练时总是报错: TypeError: Caught TypeError in replica 1 on device 1. TypeError: forward() missing 1 required positional argument: 'x'百度了一下发现是因为我使用了多个显卡,导致在inference阶段,模型和数据不在同一个显卡上,所以后面同时报了:TypeError: forward() missing 1 re...转载 2021-08-06 14:44:52 · 4634 阅读 · 0 评论 -
ubuntu 下NCCL安装
1 去这里下载nccl库https://developer.download.nvidia.cn/compute/machine-learning/repos/ubuntu1804/x86_64/2 执行sudo dpkg -i libnccl2_2.7.3-1+cuda10.2_amd64.debsudo dpkg -i libnccl-dev_2.7.3-1+cuda10.2_amd64原创 2020-09-07 11:27:29 · 1005 阅读 · 0 评论 -
关于CUDA向量求和并行规约最后一个warp的展开理解
CUDA向量求和并行规约有很多内容涉及,在此只说并行规约最后一个warp的展开理解。我参考的是:Professional CUDA C中的chapter3中的一个例子。Professional CUDA C写的非常好,层次分明,逐渐深入,一个例子从最原始实施到逐步优化完善;cuda官网上也有并行规约:https://developer.download.nvidia.cn/assets/c...原创 2019-10-06 20:58:07 · 696 阅读 · 3 评论