我有一个PyCUDA Python脚本,我想使用花哨的Nsight进行配置文件。
我设置了一个构建外部工具配置,指向示例脚本(带有可执行权限,下面包含)。然后我可以运行它,并在控制台中查看打印输出。然后我进入配置文件模式,然后单击运行 - >配置文件---我在控制台中看到打印输出,但没有可见的配置文件信息。在Nsight中运行C/CUDA程序时,如何获得时序图和占位计算器以及NVIDIA对我的代码的建议?
这里总的IDE noob(主要是命令行),抱歉如果我的问题不包括关键信息。 Ubuntu 11.10,PyCUDA 2012.1。
example.py:
#!/usr/bin/env python
import pycuda.autoinit
import pycuda.driver as drv
import numpy
from pycuda.compiler import SourceModule
mod = SourceModule("""
__global__ void multiply_them(float *dest, float *a, float *b)
{
const int i = threadIdx.x;
dest[i] = a[i] * b[i];
}
""")
multiply_them = mod.get_function("multiply_them")
a = numpy.random.randn(400).astype(numpy.float32)
b = numpy.random.randn(400).astype(numpy.float32)
dest = numpy.zeros_like(a)
multiply_them(
drv.Out(dest), drv.In(a), drv.In(b),
block=(400,1,1), grid=(1,1))
print "error:", numpy.sum(numpy.abs(dest - a*b).ravel())
print "Done"
#pycuda.autoinit.context.detach() # seems to break PyCUDA 2012.1
+1
如果从命令行运行nvvp,然后输入命令以这种方式运行pyCUDA应用程序(在可视化分析器启动向导/对话框中),会发生什么情况?只是试图了解这是一个日食问题还是视觉分析问题。 –
+0
nvvp是我需要的!它能够剖析我的代码并向我展示我想看到的一切。我将使用nvvp而不是nsight。 –