我今天尝试了linux的perf实用程序,但在解释其结果时遇到了麻烦。 我习惯了valgrind的callgrind,这当然是与基于perf的采样方法完全不同的方法。
我做了什么:
perf record -g -p $(pidof someapp)
perf report -g -n
现在我看到这样的事情:
+ 16.92% kdevelop libsqlite3.so.0.8.6 [.] 0x3fe57 ↑
+ 10.61% kdevelop libQtGui.so.4.7.3 [.] 0x81e344 ▮
+ 7.09% kdevelop libc-2.14.so [.] 0x85804 ▒
+ 4.96% kdevelop libQtGui.so.4.7.3 [.] 0x265b69 ▒
+ 3.50% kdevelop libQtCore.so.4.7.3 [.] 0x18608d ▒
+ 2.68% kdevelop libc-2.14.so [.] memcpy ▒
+ 1.15% kdevelop [kernel.kallsyms] [k] copy_user_generic_string ▒
+ 0.90% kdevelop libQtGui.so.4.7.3 [.] QTransform::translate(double, double) ▒
+ 0.88% kdevelop libc-2.14.so [.] __libc_malloc ▒
+ 0.85% kdevelop libc-2.14.so [.] memcpy
...
好的,这些功能可能很慢,但是如何找出从哪里调用这些功能? 由于所有这些热点都位于外部库中,因此我看不到优化代码的方法。
基本上,我正在寻找一种带有累计成本的标注的callgraph,其中我的函数比我调用的库函数具有更高的包含采样成本。
性能有可能吗? 如果是这样-如何?
注意:我发现“ E”展开了调用图,并提供了更多信息。 但是,调用图通常不够深和/或随机终止,而没有提供有关在哪里花费了多少信息的信息。 例:
- 10.26% kate libkatepartinterfaces.so.4.6.0 [.] Kate::TextLoader::readLine(int&...
Kate::TextLoader::readLine(int&, int&)
Kate::TextBuffer::load(QString const&, bool&, bool&)
KateBuffer::openFile(QString const&)
KateDocument::openFile()
0x7fe37a81121c
我在64位上运行是否会成为问题? 另请参见:[http://lists.fedoraproject.org/pipermail/devel/2010-November/144952.html](我没有使用fedora,但似乎适用于所有64位系统)。