在开发过程中,我们或多或少会关注服务的性能。但是性能优化相对来说比较困难,往往需要多轮的优化和测试,费时费力,有时可能不会有很好的效果。但如果有更好的性能优化方法指导和工具辅助分析,就可以快速找到性能瓶颈,有针对性地进行优化,事半功倍。
性能优化的难点在于找出关键的性能瓶颈。如果没有一些工具的帮助,很难找到这些瓶颈。例如,在c++程序中,大多数人可能使用perf /bcc工具来找出哪里有性能瓶颈。性能瓶颈的原因很多,CPU、内存、磁盘、架构等等。本文只关注CPU调优,即如何引流CPU性能,最大化CPU吞吐量。(其实CPU的性能出厂时就已经决定了,我们需要做的是让CPU尽可能做有用的工作。)所以为了优化CPU利用率,我们其实是发现自己写的代码不够好,没有优化。
一、示例
#include <stdlib.h>
#define CACHE_LINE attribute((aligned(64)))
struct S1
{
int r1;
int r2;
int r3;
S1 ():r1 (1), r2 (2), r3 (3){}
} CACHE_LINE;
void add(const S1 smember[],int members,long &total) {
int idx = members;
do {
total += smember[idx].r1;
total += smember[idx].r2;
total += smember[idx].r3;
}while(–idx);
}
int main (i