perf 安装

最终解决办法:

安装最新版内核的linux 系统。

 

====================================

 

编译 compiler-rt时,

缺少 linux/perf_event.h:

解决办法:

准备使用 perf

安装 perf 非常简单,只要您有 2.6.31 以上的内核源代码,那么进入 tools/perf 目录然后敲入下面两个命令即可:

 make 
 make install 

 

Redhat Enterprise 4.3中静态编译perf

http://blog.csdn.net/justlinux2010/article/details/15340261

 

 

 

perfmon2 已不再被開發和維護。

perfmon2 需要修改Linux 內核。kernel interface 和 libpfm 各有其版本號。perfmon2.x 代表 kernel interface 的版本號。perfmon 指的是工具。Linux 2.6.31 以後,已有對 performance monitoring 的支援 (Linux Performance Counter subsystem),不再需要對 kernel 做修改。libpfm4 是利用Linux 原生支援開發的函式庫。

pfmon & libpfm3

pfmonlibpfm3 的使用請見這裡

# http://git.kernel.org/?p=linux/kernel/git/eranian/linux-2.6.git;a=summary
$ git clone git clone git://git.kernel.org/pub/scm/linux/kernel/git/eranian/linux-2.6.git
$ wget http://sourceforge.net/projects/perfmon2/files/libpfm/libpfm-3.10.tar.gz/download
$ tar xvf libpfm-3.10.tar.gz; cd libpfm-3.10
# examples_v$ 放置不同 perfmon 內核版本的範例程式
$ cd examples_v2.x
# 可得知內核版本和 libpfm 版本號
$ pfmon -I
pfmlib version: 3.9
kernel perfmon version: 2.9
# perfmon 內核版本 2.9
$ ./self
sycall base 297
major version 2
minor version 9
# 此為 libpfm 版本號
$ pfmon -V
pfmon version 3.8 Date: Jul 17 2009
Copyright (C) 2001-2007 Hewlett-Packard Company
# 列出所有事件
$ pfmon -l
# 列出事件詳細資訊
$ pfmon -i UNC_QMC_NORMAL_READS
Name     : UNC_QMC_NORMAL_READS
Code     : 0x2c
Counters : [ 20 21 22 23 24 25 26 27 ]
Desc     : QMC channel 0 normal read requests
Umask-00 : 0x01 : [CH0] : QMC channel 0 normal read requests
Umask-01 : 0x02 : [CH1] : QMC channel 1 normal read requests
Umask-02 : 0x04 : [CH2] : QMC channel 2 normal read requests
Umask-03 : 0x07 : [ANY] : QMC normal read requests
PEBS     : No
Uncore   : Yes

PEBS 全名為 Precise Event-Based Sampling,這是用來避免採樣上的誤差 (10.3 Sampling modules, 5. Precise Event-Based Sampling (PEBS))。欲使用 PEBS 必須確定 perfmon 版本的內核介面為 2.81 以上,且須載入特定的內核模組。

$ pfmon --smpl-module=pebs

Uncore 代表這是一 socket-level,非單一核獨享的計數器。Umask 可以用來修飾事件 (4.9 Using events with unit masks)。

$ pfmon --system-wide --cpu-list=1 -u -k -e UNC_QMC_NORMAL_READS:CH2 ls

採樣

關於 pfmon 採樣的流程請見 10. Sampling with pfmonpfmon 提供 –short-smpl-period–long-smpl-periods 兩個選項用來指定每發生多少事件就要採樣一次;後者是用來消除採樣時 pfmon 存取 kernel buffer 所造成的誤差1)

--short-smpl-period=500,000 --smpl-periods-random=1000000:1000000

–smpl-periods-random 用來調整採樣週期,注意其 seed 欄位在 perfmon 2.2 以後不再被使用。2)。調整後的範圍為 mask +/- periods。

perf & libpfm4

簡介

Linux 內核提供 perf_events 又稱 Linux Performance Counter subsystem,其標頭檔為/usr/include/linux/perf_event.h。關於其介紹請見Performance Counters for LinuxThe future of perf eventsperf 是相對於 pfmon 的工具,可從 /usr/src/linux/tools/perf 安裝。文件請在/usr/src/linux/tools/perf 尋找。安裝時請注意tools/perf 代碼是否需要更新。3) 關於 perf_events 開發的討論串請見 http://thread.gmane.org/gmane.comp.linux.perfmon2.devel/1312/focus=1350

安裝和使用

# http://git.kernel.org/?p=linux/kernel/git/torvalds/linux-2.6.git;a=summary
$ git clone git://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux-2.6.git
# 需要 2.6.31 以後的內核
$ uname -r
2.6.38-rc7-00051-gcbdbb4c-dirty
$ cd /usr/src/linux/tools/perf
$ sudo make NO_LIBPYTHON=1
$ sudo cp perf perf-archive /usr/local/bin
$ git clone git://perfmon2.git.sourceforge.net/gitroot/perfmon2/libpfm4
$ cd libpfm4; make
$ cd examples
# 顯示支援的事件,分別有平台特定和通用的事件。-h 可列出其它選項
$ ./showevtinfo [-h]
#-----------------------------
IDX      : 90177536
PMU name : ppc970 (PPC970)
Name     : PM_LSU_REJECT_RELOAD_CDF
#-----------------------------
IDX      : 106954771
PMU name : perf (perf_events generic PMU)
Name     : PERF_COUNT_HW_CACHE_BPU
# 顯示事件的編碼
$ ./check_events PERF_COUNT_HW_CACHE_ITLB

perf list 只會列出通用的事件名稱。如果需要採樣平台特定的事件則需要特定編碼,請見 Documentation/perf-list.txtevt2raw 是用來將事件轉成編碼供perf 使用。平台上所提供的事件可由 showevtinfo 查詢。4)

# X86 平台
$ cd libpfm4/perf_examples
$ ./evt2raw inst_retired:any_p
r5300c0
$ perf stat -e `evt2raw inst_retired:any_p` /bin/ls
$ cd libpfm4/perf_examples
$ ./task_smpl -e PERF_COUNT_HW_CACHE_ITLB:period=100 ls

libpfm4/perf_examples 裡,perf_util.hperf_util.cperf_evnets 提供 helper function。Trace point 請見 Fun with tracepoints

perf 除了 cycles 這個事件以外,其它事件的採樣皆有誤差5)perf 可以在要採樣的事件加上修飾字 (請見 Documentation/perf-list.txt),改用較精準的採樣,如: PEBS ( About Precise Event Based Sampling Performance Tuning Events)。

$ perf record -e branch-misses:p

showevtinfo

#-----------------------------
IDX      : 23068780
PMU name : core (Intel Core)
Name     : X87_OPS_RETIRED
Equiv    : None
Flags    : [precise]
Desc     : FXCH instructions retired
Code     : 0xc1
Umask-00 : 0x01 : PMU : [FXCH] : None : FXCH instructions retired
Umask-01 : 0xfe : PMU : [ANY] : [default] [precise] : Retired floating-point computational operations (Precise Event)
Modif-00 : 0x00 : PMU : [k] : monitor at priv level 0 (boolean)
Modif-01 : 0x01 : PMU : [u] : monitor at priv level 1, 2, 3 (boolean)
Modif-02 : 0x02 : PMU : [e] : edge level (boolean)
Modif-03 : 0x03 : PMU : [i] : invert (boolean)
Modif-04 : 0x04 : PMU : [c] : counter-mask in range [0-255] (integer)

Umask 若皆沒有 [default] 字樣,則必須在 Name 之後加上某一個 Umask。

$ evt2raw -v X87_OPS_RETIRED
r53fec1 core::X87_OPS_RETIRED:ANY:e=0:i=0:c=0:u=1:k=1:precise=0
$ evt2raw -v X87_OPS_RETIRED:FXCH
r5301c1 core::X87_OPS_RETIRED:FXCH:e=0:i=0:c=0:u=1:k=1:precise=0

Modif 可以如下使用:

$ ./perf_examples/evt2raw -v X87_OPS_RETIRED:precise=1:i=1
rd3fec1 core::X87_OPS_RETIRED:ANY:e=0:i=1:c=0:u=1:k=1:precise=1

PBES

perf list 無法得知事件是否支援 PBES。改用 showevtinfo 查詢。

# 檢查 CPU 和內核是否支援 PBES
$ dmesg | grep "Performance Events"
Performance Events: PEBS fmt0+, Core2 events, Intel PMU driver.

其它

$ perf stat -e branches:pp ls
No permission to collect stats.
Consider tweaking /proc/sys/kernel/perf_event_paranoid.

/proc/sys/kernel/perf_event_paranoid 用來控制一般使用者在使用 perf 上的權限6)。請見kernel/perf_event.c 中的註釋:

/*
 * perf event paranoia level:
 *  -1 - not paranoid at all
 *   0 - disallow raw tracepoint access for unpriv
 *   1 - disallow cpu events for unpriv
 *   2 - disallow kernel profiling for unpriv
 */
int sysctl_perf_event_paranoid __read_mostly = 1;

 

google-perftools 简介 google-perftools 是一款针对 C/C++ 程序的性能分析工具,它是一个遵守 BSD 协议的开源项目。使用该工具可以对 CPU 时间片、内存等系统资源的分配和使用进行分析,本文将重点介绍如何进行 CPU 时间片的剖析。 google-perftools 对一个程序的 CPU 性能剖析包括以下几个步骤。 1. 编译目标程序,加入对 google-perftools 库的依赖。 2. 运行目标程序,并用某种方式启动 / 终止剖析函数并产生剖析结果。 3. 运行剖结果转换工具,将不可读的结果数据转化成某种格式的文档(例如 pdf,txt,gv 等)。 安装 您可以在 google-perftools 的网站 (http://code.google.com/p/google-perftools/downloads/list) 上下载最新版的安装包。为完成步骤 3 的工作,您还需要一个将剖析结果转化为程序员可读文档的工具,例如 gv(http://www.gnu.org/software/gv/)。 编译与运行 您需要在原有的编译选项中加入对 libprofiler.so 的引用,这样在目标程序运行时会加载工具的动态库。例如本例中作者的系统中,libprofiler.so 安装在"/usr/lib"目录下,所以需要在 makefile 文件中的编译选项加入“-L/usr/lib -lprofiler”。 google-perftools 需要在目标代码的开始和结尾点分别调用剖析模块的启动和终止函数,这样在目标程序运行时就可以对这段时间内程序实际占用的 CPU 时间片进行统计和分析。工具的启动和终止可以采用以下两种方式。 a. 使用调试工具 gdb 在程序中手动运行性能工具的启动 / 终止函数。 gdb 是 Linux 上广泛使用的调试工具,它提供了强大的命令行功能,使我们可以在程序运行时插入断点并在断点处执行其他函数。具体的文档请参照 http://www.gnu.org/software/gdb/,本文中将只对用到的几个基本功能进行简单介绍。使用以下几个功能就可以满足我们性能调试的基本需求,具体使用请参见下文示例。 命令 功能 ctrl+c 暂停程序的运行 c 继续程序的运行 b 添加函数断点(参数可以是源代码中的行号或者一个函数名) p 打印某个量的值或者执行一个函数调用 b. 在目标代码中直接加入性能工具函数的调用,该方法就是在程序代码中直接加入调试函数的调用。 两种方式都需要对目标程序重新编译,加入对性能工具的库依赖。对于前者,他的好处是使用比较灵活,但工具的启动和终止依赖于程序员的手动操作,常常需要一些暂停函数(比如休眠 sleep)的支持才能达到控制程序的目的,因此精度可能受到影响。对于后者,它需要对目标代码的进行修改,需要处理函数声明等问题,但得到的结果精度较高,缺点是每次重新设置启动点都需要重新编译,灵活度不高,读者可以根据自己的实际需求采用有效的方式。 示例详解 该程序是一个简单的例子,文中有两处耗时的无用操作,并且二者间有一定的调用关系。 清单 1. 示例程序 void consumeSomeCPUTime1(int input){ int i = 0; input++; while(i++ < 10000){ i--; i++; i--; i++; } }; void consumeSomeCPUTime2(int input){ input++; consumeSomeCPUTime1(input); int i = 0; while(i++ < 10000){ i--; i++; i--; i++; } }; int stupidComputing(int a, int b){ int i = 0; while( i++ < 10000){ consumeSomeCPUTime1(i); } int j = 0; while(j++ < 5000){ consumeSomeCPUTime2(j); } return a+b; }; int smartComputing(int a, int b){ return a+b; }; void main(){ int i = 0; printf("reached the start point of performance bottle neck\n"); sleep(5); //ProfilerStart("CPUProfile"); while( i++ MyProfile.pdf 转换后产生的结果文档如下图。图中的数字和框体的大小代表了的某个函数的运行时间占整个剖析时间的比例。由代码的逻辑可知,stupidComputing,stupidComputing2 都是费时操作并且它们和 consumeSomeCPUTime 存在着一定的调用关系。 图 1. 剖析结果 结束语 本文介绍了一个 Linux 平台上的性能剖析工具 google-perftools,并结合实例向读者展示了如何使用该工具配置、使用及分析性能瓶颈。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值