如何在CUDA代码中使用虚函数(C++)

本文介绍了在CUDA代码中使用虚函数以实现可扩展性的方法。关键点在于对象需要在设备上创建。错误示例中,由于在设备上未正确初始化指向虚函数表的指针导致程序崩溃。修正方案包括在设备内存中动态分配对象,并使用二重指针以避免参数复制的问题。最后,强调了在设备上正确释放内存的重要性。
摘要由CSDN通过智能技术生成

最近做的工作需要在CUDA上使用虚函数来减轻工作量,增加软件的可扩展性。我原以为按照CPU上的编程方法就可以正常使用,然而发现自己果真是too young, too naive了。在查找了很多材料后才找到解决方案,因而记录下来分享给大家。

简介

想要在device上使用虚函数,最重要的一点:

The objects simply need to be created on the device.

上面这句话的意思就是类的实例需要在device上被创建
换言之,不能使用普通的cudaMalloc方法,而应该在__device____global__函数里使用class *A=new A;语句。

举例

如果上面解释的不清楚,请看这个例子,该例子仅仅解释我的解决方案,在实际应用中,永远不要使用带有虚函数的类的数组,否则你会哭的。
1.定义含有虚函数的父类Base和子类Derived,定义方法与CPU上的无二致。

class Base
{
public:
    __host__ __device__ Base() {}
    __host__ __device__ ~Base() {}

    __host__ __device__ virtual bool fun(int index)
    {
        printf("No.%d Base.fun(int)\n", index);
        return false;
    }

    int value;
};

class Derived :public Base
{
public:
    __host__ __device__ Derived() {}
    __host__ __device__ ~Derived() {}
    __host__ __device__ virtual bool fun(int index)
    {
        printf("No.%d Derived.fun(int)\n", index);
        return true;
    }
};

接下来的步骤是我们平时使用的方法,但请注意:它是错的。在这里举一个错误的例子来对CUDA中使用虚函数进行更清楚地讲解。
2.定义一个名为TestFun__global__函数,传入一个指向Base数组的指针,对数组中的每个元素调用虚函数fun,我们所期待的是如果传入的是Derived数组的指针,则调用Derived的fun。

__global__ void TestFun(bool *d_result, Base *d_derives, size_t size)
{
    int myId=blockDim.x*blockIdx.x+threadIdx.x;
    if (myId >= size)  
        return;  
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值