在Linux系统中,进程的调度切换是由内核自动完成的,在多核CPU上,进程有可能在不同的CPU核上来回切换执行,这对CPU的缓存不是很有利。为什么呢?先看一张 Intel i5 CPU 的缓存简单示意图:
在多核CPU结构中,每个核心有各自的L1、L2缓存,而L3缓存是共用的。如果一个进程在核心间来回切换,各个核心的缓存命中率就会受到影响。相反如果进程不管如何调度,都始终可以在一个核心上执行,那么其数据的L1、L2 缓存的命中率可以显著提高。
1. 如何设置进程与CPU核心绑定
在 Linux 系统里,可以使用 CPU_* 系列函数和 sched_setaffinity()
可以实现绑定,具体步骤如下:
- 使用 **CPU_**系列函数,必须定义 _GNU_SOURCE 宏,告诉编译器启用这些函数:
#define _GNU_SOURCE
- 首先声明一个
cpu_set_t
,然后用CPU_ZERO()
初始化bit数据:
cpu_set_t mask;
CPU_ZERO(&mask);
cpu_set_t
其实是一个bit串,每个bit表示进程是否要与某个CPU核绑定。
- 接下来把进程绑定到某几个CPU核心,这要用
CPU_SET()
来设置cpu_set_t中相应的bit位,比如想让进程只在核心1或核心5上执行:
CPU_SET(1, &mask);
CPU_SET(5, &mask);
- 最后用
sched_setaffinity
完成实际的绑定:
sched_setaffinity(0, sizeof(cpu_set_t), &mask);
设置起来并不难。那怎么验证我们的绑定真的起作用了呢?我们来做个实验:
假定有一台双核机器,这段程序我们起了20个进程,从0开始每个进程分配一个进程号(注意是这里值我们自己起的进程号,不是进程pid),奇数进程号绑定绑定在 Core 0上执行,偶数号的进程绑定在 Core 1上执行。
我们用for
让进程循环,用 sched_getcpu()
函数获得当前进程运行在哪个CPU核心上,每次for
循环检查下进程是否真的在分配的核心执行。
#define _GNU_SOURCE
#include <sched.h>