关于纳秒级Benchmark

对于执行时间极短的程序(<1ms)进行benchmark,要注意以下几点:

  1. 固定CPU频率,变频时,CPU会停顿,overhead可达6~50us,如果是支持invariant TSC,通过RDTSC或RDTSCP指令可避免因频率变化导致的耗时误差;
  2. 绑核,隔离CPU核(无法阻止内核进程调度到该核,所以cpu中断还是无可避免,关闭cpu中断需重编译内核);
  3. NUMA架构防止内存访问跨节点,跨CPU造成的波动;
  4. 去除多级缓存影响。程序多次执行时,数据又可能会由内存加载至高速缓存或寄存器,从而影响程序执行速度;
  5. 避免大量I/O。

相关参考:

  1. https://sites.utexas.edu/jdm4372/2018/07/23/comments-on-timing-short-code-sections-on-intel-processors/
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值