【C/C++】性能优化之打点计时(纳秒级)

这篇博客介绍了如何通过添加时间戳来测量printf函数的执行耗时。首先,通过bind_core函数将进程绑定到特定核心,然后在循环中使用开始和结束时间戳记录printf操作的时间,并利用GATHERING_NS宏收集数据。最后,通过perf_latency_dump_ns函数输出性能数据。
摘要由CSDN通过智能技术生成

目的:加时间戳打印是为了方便快速对性能耗时进行测试

比如想要测试printf这个函数调用的耗时

bind_core(4);
for(int i=0;i<MAX_SAMPLES;i++){
	timing_now(now_tsc0);
	printf("11111111");
	timing_now(now_tsc1);
	GATHERING_NS(series0,now_tsc0,now_tsc1,NULL);
}

操作步骤:

  1. 隔核
  2. 绑核
  3. 加一个循环
  4. 在printf前加开始时间戳
  5. 在printf后加结束时间戳
  6. 结束时间戳后加:GATHERING_NS(series0,now_tsc0,now_tsc1,NULL);

bind_core

#include <sched.h>

void bind_core(int core_i){
	cpu_set_t cpus;
	CPU_ZERO(&cpus);
	CPU_SET(core_i, &cpus);
	if(sched_setaffinity(0,sizeof(cpus),&cpus) == -1){
		ERROR("failed bind core %u",core_i);
	} else {
		INFO("success to core %u",core_i);
	}
}

MAX_SAMPLES

#define MAX_SAMPLES 512

timing_now()

#define timing_now(val) do{ \
struct timespec abc; \
clock_gettime(CLOCK_REALTIME, &abc); \
(val) = (unsigned long)abc.tv_sec * 1000000000lu + (unsigned long)abc.tv_nsec; \
} while(0)

now_tsc0、now_tsc1

typedef uint64_t timing_t;
static timing_t now_tsc0 , now_tsc1;

GATHERING_NS()

#define CYCLE_SAMPLES_MASK (MAX_SAMPLES - 1)
#define TXT(T) #T

#define GATHERING_NS(SERIES, SEQ, TSC, LEN)\
	do { \
		SERIES.samples[SERIES.count].seq = (SEQ); \
		SERIES.samples[SERIES.count].tsc = (TSC); \
		SERIES.samples[SERIES.count].len = (LEN); \
		SERIES.count++; \
		if( SERIES.count > CYCLE_SAMPLES_MASK ) { \
			perf_latency_dump_ns(TXT(SERIES), SERIES.samples, MAX_SAMPLES); \
			} \
			SERIES.count = SERIES.count & CYCLE_SAMPLES_MASK; \
		} while(0)

SERIES

typedef struct tsc_sample_struct {
	timing_t seq;
	timing_t tsc;
	int len;
} tsc_sample_struct_t;

typedef struct series_struct {
	tsc_sample_struct_t samples[MAX_SAMPLES];
	uint32_t count;
} series_struct_t;

static series_struct_t series0;

perf_latency_dump_ns()

void perf_latency_dump_ns(const char *tag,tsc_sample_struct_t *stats, int count) {
	int i;
	for (i=0; i<count; i++) {
		printf("perl:%s:%p seq=%04lu, value[%03d]=%luns, len=%d, balance=%ld\n",
		tag, stats, stats[i].seq, i, stats[i].tsc, stats[i].len, stats[i].tsc - stats[i].seq);	
	}
}
### 回答1: 获取系统时间差的方法可以使用C/C++中的时间库、系统调用等方式实现。以下是一些获取毫秒/微秒/纳秒系统时间差的方法: 1. time()函数 time()函数返回的是自1970年01月01日00时00分00秒到目前为止的秒数,可以利用该函数计算两个时间点之间的秒数差。不过time()函数的精度只能达到秒别,无法满足毫秒/微秒/纳秒别的需求。 2. gettimeofday()函数 gettimeofday()函数可以获取当前的系统时间和时区,其精度可以达到微秒别。可以使用该函数计算当前时间点和目标时间点之间的时间差,注意需要将微秒转换为秒。 3. clock()函数 clock()函数返回程序运行时间,可以用于计算程序执行时间。但是clock()函数的精度依赖于系统,无法保证毫秒别的精度。 4. clock_gettime()函数 clock_gettime()函数可以获取系统时间,并且其精度可以达到纳秒别。可以使用该函数计算两个时间点之间的时间差,其中需要指定时钟类型(如CLOCK_REALTIME、CLOCK_MONOTONIC等)。 5. high_resolution_clock类 C++11中提供了high_resolution_clock类,可以获取高精度的系统时间。该类可以获取毫秒/微秒/纳秒别的时间,可以使用该类计算两个时间点之间的时间差。 以上就是一些获取系统时间差的方法,其中精度和使用方式不同。需要根据实际需求选择合适的方法来计算时间差。 ### 回答2: 获取系统时间是计算机程序中非常常见的操作,通常需要用到毫秒、微秒或纳秒别的时间差来衡量不同操作之间的效率或时间间隔。下面介绍几种获取时间差的方法: 1. time库函数 time库函数可以获取当前系统时间,使用方法如下: ``` #include <time.h> void time (time_t *timer); ``` 其中,time_t是一个长整型的时间类型,timer是一个指向time_t类型变量的指针。这个函数返回的是1970年1月1日0时0分0秒到当前时间的秒数。我们可以获取两次时间,然后计算它们之间的时间差,从而得到毫秒、微秒或纳秒别的时间差。 2. gettimeofday函数 gettimeofday函数可以获取当前系统时间,使用方法如下: ``` #include <sys/time.h> int gettimeofday(struct timeval *tv, struct timezone *tz); ``` 其中,struct timeval是一个结构体类型,用于表示Unix时间格式,包括秒数和微秒数。这个函数返回的是当前时间与1970年1月1日0时0分0秒之间的时间差,单位是微秒。同样地,我们可以获取两次时间,然后计算它们之间的时间差,从而得到毫秒、微秒或纳秒别的时间差。 3. clock函数 clock函数可以获取程序执行时间,使用方法如下: ``` #include <time.h> clock_t clock(void); ``` 这个函数返回的是程序自从启动后的CPU时间,单位是时钟周期。通过记录程序执行前后的时间,我们可以得到程序执行的时间差,从而得到毫秒、微秒或纳秒别的时间差。 4. rdtsc指令 rdtsc指令可以获取当前CPU周期计数器的值,使用方法如下: ``` unsigned long long rdtsc(void); ``` 这个函数返回的是64位无符号整型,表示当前CPU的时钟周期计数器的值。通过记录指令执行前后的CPU周期计数器的值,我们可以得到程序执行的时间差,从而得到毫秒、微秒或纳秒别的时间差。 因此,以上就是常用的获取毫秒、微秒或纳秒别的时间差的方法。在实际的项目开发中,我们可以根据具体需要选择合适的函数。 ### 回答3: 在C/C++语言中,获取系统时间差可以使用不同的方法来实现,其中包括获取毫秒、微秒或纳秒别的时间差。以下是获取时间差的几种常见方法: 1. clock()函数 在C/C++标准库中,可以使用clock()函数获取程序执行时间,其返回值表示自程序启动以来的处理时间,“处理时间”指的是操作系统处理程序的时间,不包括程序中sleep、wait以及输入输出等的等待时间,单位为毫秒。具体方法如下: ```c++ #include <stdio.h> #include <time.h> int main() { clock_t start_time, end_time; double duration; start_time = clock(); //开始计时 //在这里编写需要计时的程序代码 for (int i = 0; i < 10000000; i++); end_time = clock(); //结束计时 duration = (double)(end_time - start_time) / CLOCKS_PER_SEC * 1000; //计算程序执行时间,单位毫秒 printf("程序执行时间为%f毫秒\n", duration); return 0; } ``` 2. gettimeofday()函数 在Linux等Unix系统中,可以使用gettimeofday()函数获取当前时间,其返回一个struct timeval类型的结构体,详见下方例子: ```c++ #include <stdio.h> #include <sys/time.h> int main() { struct timeval start_time, end_time; long duration; gettimeofday(&start_time, NULL); //开始计时 //在这里编写需要计时的程序代码 for (int i = 0; i < 10000000; i++); gettimeofday(&end_time, NULL); //结束计时 duration = (end_time.tv_sec - start_time.tv_sec) * 1000000 + (end_time.tv_usec - start_time.tv_usec); //计算程序执行时间,单位微秒 printf("程序执行时间为%ld微秒\n", duration); return 0; } ``` 3. QueryPerformanceCounter()函数 在Windows系统中,可以使用QueryPerformanceCounter()函数获取高精度计时器的值,其返回值为LARGE_INTEGER类型的结构体,详见下方例子: ```c++ #include <stdio.h> #include <Windows.h> int main() { LARGE_INTEGER freq, start_time, end_time; //freq为计时器的纳秒精度,start_time和end_time为计时器的值 double duration; QueryPerformanceFrequency(&freq); //获取计时器精度 QueryPerformanceCounter(&start_time); //开始计时 //在这里编写需要计时的程序代码 for (int i = 0; i < 10000000; i++); QueryPerformanceCounter(&end_time); //结束计时 duration = (double)(end_time.QuadPart - start_time.QuadPart) / freq.QuadPart * 1000000; //计算程序执行时间,单位微秒 printf("程序执行时间为%f微秒\n", duration); return 0; } ``` 综上所述,以上几种方法可以分别实现获取毫秒、微秒及纳秒别的系统时间差。需要根据具体场景和需求选择不同的方法来实现。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值