这个地主要学习了《实战matlab并行程序设计》中的square这个例子
先建一个CUDA工程,然后.cu文件,把代码敲入
#include"mex.h"
#include"cuda.h"
#include "cuda_runtime.h"
#include "cuda.h"
#include "device_launch_parameters.h"
#include <iostream>
#include <cstdlib>
__global__ void square_elements(float* in,float * out ,int N)
{
int idx =blockIdx.x*blockDim.x+threadIdx.x;
if (idx<N)out[idx]=in[idx]*in[idx];
}
void mexFunction (int nlhs,mxArray *plhs[],int nrhs ,const mxArray *prhs[])
{