KVM虚拟机内进行GPU计算

最新推荐文章于 2024-06-20 21:25:30 发布

虚拟化云计算技术

最新推荐文章于 2024-06-20 21:25:30 发布

阅读量1w

点赞数 5

分类专栏： KVM虚拟化文章标签： kvm 虚拟化 GPU CUDA NVIDIA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/isclouder/article/details/79390488

版权

KVM虚拟化专栏收录该内容

17 篇文章 6 订阅

订阅专栏

（文章来自作者维护的社区微信公众号【虚拟化云计算】）

（目前有两个微信群《kvm虚拟化》和《openstack》，扫描二维码点击“云-交流”，进群交流提问）

我们知道CUDA是由NVIDIA推出的通用并行计算架构，使用该架构能够在GPU上进行复杂的并行计算。在有些场景下既需要使用虚拟机进行资源的隔离，又需要使用物理GPU进行大规模的并行计算。本文就进行相关的实践：把NVIDIA显卡透传到虚拟机内部，然后使用CUDA平台进行GPU运算的实践。

显卡型号：NVIDIA的Tesla P4

物理主机查看显卡：

# lspci | grep NVIDIA

81:00.0 3D controller: NVIDIA Corporation Device 1bb3 (rev a1)

#

把pci显卡从主机上分离：

# virsh nodedev-list

pci_0000_81_00_0

#virsh nodedev-dettach pci_0000_81_00_0

虚拟机直接指定此pci显卡：

<devices>

......

<hostdev mode='subsystem' type='pci' managed='yes'>

<source>

<address domain='0x0000' bus='0x81' slot='0x00' function='0x0'/>

</source>

<address type='pci' domain='0x0000' bus='0x00' slot='0x10' function='0x0'/>

</hostdev>

</devices>

虚拟机内部查看是否有显卡：

# lspci | grep NVIDIA

00:10.0 3D controller: NVIDIA Corporation Device 1bb3 (rev a1)

#

虚拟机内准备环境：

ubuntu16.04

# apt-get install gcc

# apt-get install linux-headers-$(uname -r)

虚拟机内CUDA Toolkit 9.1 Download：

虚拟机内CUDA Toolkit Install :

# dpkg -i cuda-repo-ubuntu1604-9-1-local_9.1.85-1_amd64.deb

# apt-key add /var/cuda-repo-9-1-local/7fa2af80.pub

# apt-get update

# apt-get install cuda

GPU运算示例 代码：

//add.cu

#include <iostream>

#include <math.h>

// Kernel function to add the elements of two arrays

__global__

void add(int n, float *x, float *y)

{

for (int i = 0; i < n; i++)

y[i] = x[i] + y[i];

}

int main(void)

{

int N = 1<<20;

float *x, *y;

// Allocate Unified Memory – accessible from CPU or GPU

cudaMallocManaged(&x, N*sizeof(float));

cudaMallocManaged(&y, N*sizeof(float));

// initialize x and y arrays on the host

for (int i = 0; i < N; i++) {

x[i] = 1.0f;

y[i] = 2.0f;

}

// Run kernel on 1M elements on the GPU

add<<<1, 1>>>(N, x, y);

// Wait for GPU to finish before accessing on host

cudaDeviceSynchronize();

// Check for errors (all values should be 3.0f)

float maxError = 0.0f;

for (int i = 0; i < N; i++)

maxError = fmax(maxError, fabs(y[i]-3.0f));

std::cout << "Max error: " << maxError << std::endl;

// Free memory

cudaFree(x);

cudaFree(y);

return 0;

}

https://devblogs.nvidia.com/even-easier-introduction-cuda/

虚拟机内编译运行：

# /usr/local/cuda-9.1/bin/ nvcc add.cu -o add_cuda

# ./add_cuda

# /usr/local/cuda-9.1/bin/nvprof ./add_cuda

运行结果：

从运算结果看出，我们在虚拟机内部运行的程序确是执行在Tesla P4上。之后我们就可以在虚拟机内部运行深度学习的算法了。

============================================================================

关注微信公众号【虚拟化云计算】，阅读更多虚拟化云计算知识，纯技术干货更新不停。

虚拟化云计算技术

关注

5
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
KVM虚拟机内进行GPU计算

（文章来自作者维护的社区微信公众号【虚拟化云计算】）（目前有两个微信群《kvm虚拟化》和《openstack》，扫描二维码点击“云-交流”，进群交流提问）我们知道CUDA是由NVIDIA推出的通用并行计算架构，使用该架构能够在GPU上进行复杂的并行计算。在有些场景下既需要使用虚拟机进行资源的隔离，又需要使用物理GPU进行大规模的并行计算。本文就进行相关的实践：把NVIDIA显卡...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。