当perf stat -e branches 是统计
再看perf record,perf record是为了是记录时间发生的时候的调用栈,
在我的测试代码中总共有200,000,000条branch的命令,但是为啥我只看到了1964这样一个数量级的采样呢?
perf record设置了采样的频率吗?
发现了和sample_freq相关,这个sample_freq是干啥的?
表示我一秒钟采样多少次,但是这里有个问题,原来系统默认的采样频率是4000,那么这里就涉及到了所有管控涉及到的采样频率的问题了。如果这个进程在采样周期内都只发生了三次的branch事件,
采样频率是4000是什么意思?是时间计数器溢出吗?采样的频率是怎么定的?一条指令每秒中连4000条指令都不到这个就说不过去了,
应该cycles:pp是什么意思?
那么问题就来了,对于 cycles来说还能做采样,对于branches事件来说,要怎么做采样呢?因为CPU的时钟周期是固定的,但是branchs这些事件却不是固定的,所以对于函数来说,cycles在一个时钟周期内是均匀的,只要做一个溢出就可以采集到事件,那么在perf record的指令来说,perf record -e branches又有什么实际的物理意义呢?
-e中指定的事件: -e branches,确实会导致文件系统中记录下这个值的,使用perf report的时候会告诉你这个事件发生了多少次,但是
采样的频率是比较难以理解的,看下相关的源码,在perf系统调用中国sample_period中记录的是
sample_freq中是啥子呢
采样的事件放在哪里?
98 enum perf_hw_id {
99 /*
100 * Common hardware events, generalized by the kernel:
101 */
102 PERF_COUNT_HW_CPU_CYCLES = 0,
103 PERF_COUNT_HW_INSTRUCTIONS = 1,
104 PERF_COUNT_HW_CACHE_REFERENCES = 2,
105 PERF_COUNT_HW_CACHE_MISSES = 3,
106 PERF_COUNT_HW_BRANCH_INSTRUCTIONS = 4,
107 PERF_COUNT_HW_BRANCH_MISSES = 5,
108 PERF_COUNT_HW_BUS_CYCLES = 6,
109 };
到了真正的函数x86_pmu_hw_config,我们发现竟然在这里还有 event->hw.config = ARCH_PERFMON_EVENTSEL_INT;
直接就是