GPU
Frank(Zhiyang-Dou)
A Ph.D. candidate at HKU. Mainly focus on CG.
展开
-
GPU训练 数据并行与模型并行
数据并行 Data Parallelism每块GPU上都有完整的模型(每个GPU上的模型参数是一样的)。将原来的训练数据切分为多份,分别投喂到每个GPU上的模型。每个GPU并行运行,随后进行模型的梯度汇总更新以及不同GPU的通信/状态同步。模型并行 Model Parallelism模型并行就是:我们把模型切分,分布在不同的GPU上,随后将完整的数据送到这些切分后的不同模块中进行运算,最后将运算结果进行合并。模型切分: 我们知道一个网络有不同的层,我们可以将网络层切割分布到不同的GPU上。事实上,原创 2020-12-01 10:43:48 · 1186 阅读 · 0 评论 -
Ubuntu GPU及内存资源监控
综述Ubuntu GPU及内存资源监控步骤GPU监控:watch -n0.1 nvidia-smi内存等其他硬件监控。安装:sudo apt-get install htop使用:htop原创 2020-05-07 17:34:46 · 873 阅读 · 1 评论 -
Ubuntu切换显卡驱动
综述今天偶遇一个问题,就是我的cuda是10.0,之前还可以运行,今天突然在运行python时候告诉我 cuda.is_available是False。查了一下,原因是因为我的显卡驱动版本太低。381的,我应该使用410及以上的。解决方法打开system settings在software&updates中点击additional divers这里会出现所有的驱动。选择我们...原创 2019-11-16 10:41:42 · 1134 阅读 · 0 评论 -
CUDA-Ubuntu卸载cuda10.1
综述因为显卡版本问题我准备换cuda9.0因此需要卸载cuda10.1步骤cd /usr/local/cuda/binsudo ./cuda-uninstaller删除即可原创 2019-11-15 16:57:10 · 10811 阅读 · 5 评论 -
Ubuntu16安装cuda
综述这个东西,坑太多了。找了很多教程,重装系统3遍。终于ok了。环境带独显,Ubuntu16.04 安装cuda10.1传送ubuntu16.04 安装 CUDA 10.0最新详细教程(显卡是Tesla V100)就看这个就够了!...翻译 2019-09-04 15:40:25 · 265 阅读 · 0 评论 -
问题解决no matches found: nvidia-*
出现问题:no matches found: nvidia-*解决方案:sudo apt-get purge "nvidia*"原创 2019-09-19 14:36:01 · 3693 阅读 · 0 评论 -
UBuntu16配置Nvidia 驱动循环登录问题
UBuntu16配置Nvidia 驱动循环登录问题:https://blog.csdn.net/ssmixi/article/details/73483795转载 2019-09-19 15:55:54 · 290 阅读 · 0 评论 -
Ubuntu只有一个分辨率800
综述Ubuntu分辨率只有一个分辨率当然xrandr也没法修改看上去很难受解决方法sudo apt install nvidia-cuda-tookit原创 2019-10-06 13:55:50 · 1734 阅读 · 0 评论