oprofile起源于 John Levon (Victoria U of Manchester)的一篇硕士论文,最初它以DCPI(DEC Continuous Profiling Infrastructure)为模型,并最先支持Intel Pentium Pro和AMD Athlon。oprofile主要是通过采样,利用CPU上的性能计数器(perfomance counter,在龙芯上分别为CP0的24和25号寄存器)统计某些事件的发生次数。它由内核模块和用户空间守护进程两部分组成,前者可以访问性能计数器,后者则负责从性能计数器收集数据。
oprofile有两种采样方式:基于事件的采样(performance counter)和基于事件的采样(timer)。前者需要CPU上性能计数器的支持,可以人为选择要profiling的事件类型。后者适用于无性能计数器的CPU,记录每一个时钟周期。
oprofile使用(事件模式):
1、在2.6及其以后版本的Linux中都以模块方式集成了oprofile,如要使用,首先加载。
opcontrol --init
2、清除oprofile中的历史数据。
opcontrol --reset
3、配置
opcontrol --setup --event=name:count:unitmask:kernal:user
name:事件名
count:计数器值,即事件发生多少次后,oprofile记录一次
unitmask:硬件单元任务
kernal:cpu在OS内核运行时是否统计(0或者1)
user:cpu在OS用户级是否统计(0或者1)
其中oprfile所支持的事件类型可以通过使用命令opcontrol -l获取。
例:opcontrol --setup --event=CYCLES:1000::0:1 --event=ITLB_MISSES:1000::0:1
性能计数器0和1分别统计时钟和ITLB缺失事件,事件每发生1000次oprofile记录一次,硬件单元任务为0x0f,cpu处 于内核级不计数,处于用户级则计数。
4、启动
opcontrol --start/-s
5、运行要检测的程序
./a.out
6、由用户级守护进程取出统计数据
opcontrol --dump/-d
7、停止
opcontrol --stop/-t 停止核心模块
opcontrol --shutdown/-h 停止用户级守护进程
8、读取数据
opreport -l -o data.txt 将整体统计数据存入data.txt
opannotate -s --output-dir=an/ 在源程序中添加注释,并按照源文件的目录结构生成目录an
官方用户手册:
http://oprofile.sourceforge.net/doc
csdn参考文章:
http://blog.csdn.net/yili_xie/archive/2009/12/02/4925648.aspx
Oprofile工作原理介绍:
http://blog.csdn.net/normalnotebook/archive/2009/12/19/5040089.aspx
一篇比简洁的介绍:
http://www.linuxdiyf.com/viewarticle.php?id=89644
ibm的一些深入的分析:
http://www.ibm.com/developerworks/cn/linux/l-pow-oprofile/
http://www.ibm.com/developerworks/cn/linux/l-oprof/
ftrace:
http://www.ibm.com/developerworks/cn/linux/l-cn-ftrace/
http://www.ibm.com/developerworks/cn/linux/l-cn-ftrace1/
csdn介绍:
http://blog.csdn.net/gracioushe/archive/2011/01/25/6163960.aspx
http://blog.csdn.net/sandflee/archive/2010/07/21/5751844.aspx