CUDA之向量点乘和矩阵乘法 计算类似矩阵乘法的数学运算 1. 向量点乘 两个向量点乘运算定义如下: #真正的向量可能很长,两个向量里边可能有多个元素 (X1,Y1,Z1) * (Y1,Y2,Y3) = X1Y1 + X2Y2 + X3Y3 这种原始输入是两个数组而输出却缩减为一个(单一值)的运算,在CUDA里边叫规约运算 该运算对应的内核函数如下: #include "stdio.h" #include