与其他语言相比,使用Go编程CUDA有点复杂。 尽管有一些出色的软件包,例如mumax ,但文档很差,缺少示例并且很难使用。
CUDA用于C语言 ,所以最好的选择是使用Command cgo并使用您的Cuda内核调用外部函数。 这就是我在此示例中所做的事情,在该示例中,我使用CUDA将两个矩阵相乘。
如果您想了解有关CUDA编程的更多信息,请阅读我的文章 。
核心
我创建了一个简单的内核 ,该内核
与其他语言相比,使用Go编程CUDA有点复杂。 尽管有一些出色的软件包,例如mumax ,但文档很差,缺少示例并且很难使用。
CUDA用于C语言 ,所以最好的选择是使用Command cgo并使用您的Cuda内核调用外部函数。 这就是我在此示例中所做的事情,在该示例中,我使用CUDA将两个矩阵相乘。
如果您想了解有关CUDA编程的更多信息,请阅读我的文章 。
我创建了一个简单的内核 ,该内核