可以参考cutlass的examples/01_cutlass_utilities和12_gemm_bias_relu使用
cutlass代码库的tools/util/里面提供了非常方便的hosttensor相关操作方法
https://github.com/NVIDIA/cutlass
类或结构体传递给cuda kernel需要把这个类或结构体数据拷贝到GPU,从而在kernel中使用该结构体。
可以参考cutlass的examples/01_cutlass_utilities和12_gemm_bias_relu使用
cutlass代码库的tools/util/里面提供了非常方便的hosttensor相关操作方法
https://github.com/NVIDIA/cutlass
类或结构体传递给cuda kernel需要把这个类或结构体数据拷贝到GPU,从而在kernel中使用该结构体。