服务器测试之GPU shoc-master测试

精简版指导
lspci | grep -i nvidia
lspci -s 4f:00.0 -vvv

适用版本
cuda_11.8.0_520.61.05_linux.run
cuda-samples-11.8.tar.gz
NVIDIA-Linux-x86_64-525.116.04.run
安装: ./NVIDIA-Linux-x86_64-525.116.04.run
查看是否为一拖八:nvidia-smi topo -m
禁用nouveau
lsmod |grep -i nouveau
rmmod nouveau
安装cuda:./cuda_11.8.0_520.61.05_linux.run
vi ~/.bashrc
最后添加两行环境后,保存退出 执行source ~/.bashrc
export PATH=/usr/local/cuda-11.8/bin/: P A T H e x p o r t L D L I B R A R Y P A T H = / u s r / l o c a l / c u d a − 11.8 / l i b 64 : PATH export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64: PATHexportLDLIBRARYPATH=/usr/local/cuda11.8/lib64:LD_LIBRARY_PATH

下载shoc-master.zip,传到服务器上,
解压:unzip shoc-master.zip
cd shoc-master
yum install -y libstdc++.so.6
./configure CUDA_CPPFLAGS=“-gencode=arch=compute_86,code=sm_86” CXXFLAGS=" -g -O2 -L/usr/local/cuda/lib64 -lcudart -lcuda" --host=x86_64,注:红色字体需根据下表的型号调整,无<>。
编译:make install -j 40
执行测试:
单卡./bin/shocdriver -s 4 -cuda -d 0

4卡:./bin/shocdriver -s 4 -cuda -d 0 >>4R-0.log & ./bin/shocdriver -s 4 -cuda -d 1 >>4R-1.log &
./bin/shocdriver -s 4 -cuda -d 2 >>4R-2.log & ./bin/shocdriver -s 4 -cuda -d 3 >>4R-3.log

8卡:./bin/shocdriver -s 4 -cuda -d 0 >>8R-0.log & ./bin/shocdriver -s 4 -cuda -d 1 >>8R-1.log &
./bin/shocdriver -s 4 -cuda -d 2 >>8R-2.log & ./bin/shocdriver -s 4 -cuda -d 3 >>8R-3.log &
./bin/shocdriver -s 4 -cuda -d 4 >>8R-4.log & ./bin/shocdriver -s 4 -cuda -d 5 >>8R-5.log &
./bin/shocdriver -s 4 -cuda -d 6 >>8R-6.log & ./bin/shocdriver -s 4 -cuda -d 7 >>8R-7.log
在这里插入图片描述
测试结果日志
在这里插入图片描述

显存吞吐
cd /
./stream_test
在这里插入图片描述

带宽
tar -zxvf cuda-samples-11.8.tar.gz
cd cuda-samples-11.8/Samples/1_Utilities/bandwidthTest/
make
./bandwidthTest >>bandwidthTest.log
在这里插入图片描述

卸载cuda指导:此步无需操作
cd /usr/local/cuda/bin
./cuda-uninstall
enter勾选所有
点最下面的uninstall

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
1 页 Edit by Joson https://www.baidu.com/p/happy_Joson Stree_GPU 压力测试 一、测试介绍 常搞服务器测试的,会有很多测试工具,比如测试硬盘的 iometer,网络测 试的有 IxChariot,IPfer,测试内存的有 stree,整机压力测试 HPC_Breakin 等,但 整机测试 GPU 或是显卡的工具就比较少,专业的测试是必须要有的。 很多个人或是公司买了 GPU 服务器,显卡回来,安装上去后,不知道如 何整机测试,怎么压力测试,怎么检测是否有问题,做开发设计的怎么测试主板 是否有 bug,整机散热调优方案,功耗测试等,通过使使用 stree_GPU 工具,可 以使 GPU/显卡发挥 90%以上的性能,从而发现存在的隐患。 直接介绍一套简单的测试工具 Stree_GPU, 适合在 windows 7,win8,win10,2008 R2 等 windows 系统下测试的。 2 页 Edit by Joson https://www.baidu.com/p/happy_Joson 1、 准备工作环境 你的机器安装上显卡/GPU 卡后,然后再安装上述的操作系统,机器需要连外 网才能使用 Stree_GPU 测试。但它不占用外网资源。 2、安装驱动 这个不用我说了,你电脑上驱动都要安装,GPU/显卡一般是基于 NVIDIA 芯 片开发的,驱动一般直接到它官网上下载,或是安装个驱动人生,然后让它帮你 全部安装完驱动,省事^_^ 二、 测试工具使用介绍 1、Stree_GPU 工具使用介绍,此 stree_GPU 软件适用 windows 系统下 GPU/显卡专业测试工具 stree_GPU 测试工具下载: https://pan.baidu.com/s/1PnxbcIQvM9Y4YtVude7WNg 2、首先你的机器在 windows 下环境配置好,即显卡驱动要安装上,可以在 NVIDIA 官网下载 cuda 程序安装,能识别到你的显卡并能调休; 3、确保你测试的机器连通外网,因为测试时要模拟卡的压力(算力) ; 4、把 Stree_GPU 程序解压后拷贝到如 c 盘根目录下,路径不要有中文; 5、解压后在 Stree_GPU 目录里,右键以管理员权限运行 stree_GPU.bat 注意观察,如果执行之后屏幕上没有提示错误提示,没有红色的提示,则表示 开始跑起来了,过一会才会有结果,比如会提示有 GPU0:xxxMh/s,这里只要有 数字出现就表示成功了,如果有多张卡,这里会列出来有 GPU0,GPU1…..。如下 3 页 Edit by Joson https://www.baidu.com/p/happy_Joson 图所示 机器测试压力程序已经跑起来了,那么就可以在功耗仪上读取电压,电流,功耗 数值,如下图所示。 同时可以通过 BMC 管理界面,或是第三方的一些软件,可以监控到机器的各个 部件温度曲线的变化。测试时间越长,如果曲线波动不大,说明机器散热良好。 4 页 Edit by Joson https://www.baidu.com/p/happy_Joson 注意事项: 因为压力测试,注意机器的散热。风扇调全速转。机器跑起来了,此时可以测试 整机的功耗,散热、主板的供电,整机供电等等,一般测试时长 24H,这样可以 检验整机及部件稳定性等。这是最简单但最有效果的测试 GPU/显卡方案。 另外需要注意的是,机器要保持连接外网,并且测试过程不要断开网络,否则测 试不能进行。
Shoc Benchmark是一个在高性能计算平台上测试和评估算法性能的工具。要编译Shoc Benchmark,需要按照以下步骤进行操作。 首先,确保您的计算平台安装了必要的软件和工具。这些工具通常包括编译器(如GCC或Clang)、CUDA工具包和OpenCL SDK等。确保这些软件和工具的版本与Shoc Benchmark的要求相匹配。 然后,下载Shoc Benchmark的源代码。您可以从Shoc Benchmark的官方网站或GitHub存储库中获取源代码。将源代码下载到您的计算机上的合适目录中。 接下来,打开命令行界面,并进入存储源代码的目录。使用合适的编译器命令编译Shoc Benchmark。具体的编译命令可能因平台和要测试的算法而有所不同。在编译之前,您可以通过查阅Shoc Benchmark的文档或源代码中的README文件来了解编译的详细信息。 运行编译命令后,编译器将会将Shoc Benchmark的源代码编译成可执行文件。编译完成后,您可以在指定的目录中找到生成的可执行文件。 最后,您可以通过运行生成的可执行文件来执行Shoc Benchmark测试。该可执行文件将会加载和运行相应的算法,并记录性能数据和指标。您可以使用这些数据来评估算法在特定计算平台上的性能。 需要注意的是,编译Shoc Benchmark可能因不同的计算平台和操作系统而有所不同。在编译过程中,可能会遇到一些依赖性问题或错误。解决这些问题可能需要调整编译器选项、安装缺少的软件包或更新系统配置。因此,在开始编译之前,请确保您已经详细了解了Shoc Benchmark的编译要求,并适应您计算平台的情况进行调整。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

漂亮的丑小鸭丫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值