先附上代码,这是上次进行多线程运算的程序。
不同的是最后多了行代码:
cudaThreadExit(); //加上这个可以用 NVIDIA visual profiler进行分析
这行代码是保证分析时进行判断是否运行完的,不然分析软件一直会在分析GPU的运行状态,产生无用的垃圾信息。
下面是要分析的多线程程序
//GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版 增加计时函数 没有为主机变量分配内存 //
//书中程序160页
#include <stdio.h>
#include <iostream>
#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_")
#include <device_launch_parameters.h> //我在查询中找到的头文件 有可能有别的表达方式
#include <time.h> //计时用的函数库