perf对多线程Profile简单流程

本文介绍了如何使用perf工具对多线程程序进行性能分析。首先讲解了perf的基本原理和背景知识,然后详细阐述了如何为未启动和已启动的程序设置采样,以及如何下载FlameGraph来生成火焰图。最后提到了针对单个线程和多个线程生成火焰图的方法,并提供了相关参考资料。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景知识

Perf是用于软件性能分析的工具,通过Perf,应用程序可以利用PMU,tracepoint和内核中的特殊计数器进行性能统计。Perf不但可以分析应用程序的性能问题(per thread),也可以分析内核的性能问题,处理所有性能相关的事件:程序运行期间的硬件事件,如instructions retired ,processor clock cycles等;软件事件,如Page Fault和进程切换。

Perf基本原理是对被监测对象进行采样,最简单的情形是根据tick中断进行采样,即在tick中断内触发采样点,在采样点里判断程序当前的上下文。假如一个程序90%的时间都花费在函数func1()上,那么90%的采样点都应该落在函数func1()的上下文中,采样时间越长,上述推论越可靠。使用perf要有管理员权限

使用perf对多线程进行profile

准备多线程程序

在此程序中,创建了两个线程。分别跑了不同次数的func1()方法。gcc -lpthread main.c

#include <pthread.h>
#include <stdio.h>
#include <string.h>

pthread_t thread[2];

void func1() {
   
    int i = 0;
    while (i<10000)
        ++i;
}

void func2() {
   
    int i = 0;

    while (i<10000)
        i = i*2;
    func1();
}

void *thread1()
{
   
        for (;<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值