内核中通常会定义很多的pcpu变量,这样有几个好处
- 增加数据访问的并发量
- 减少数据访问的时延
从定义上就可以看出pcpu变量就是每个cpu都有某个变量的副本,各自访问各自的。那在实现上是怎么做的呢?我们今天就来看一下。
如何定义
我们先来看静态pcpu变量是如何定义的。
通常我们定义一个pcpu变量使用这样的语句。
DEFINE_PER_CPU(int, numa_node);
这样就定义了一个int类型,名字为numa_node的变量。接下来就深入研究一下。
DEFINE_PER_CPU
#define DEFINE_PER_CPU(type, name) \
DEFINE_PER_CPU_SECTION(type, name, "")
#define DEFINE_PER_CPU_SECTION(type, name, sec) \
__PCPU_ATTRS(sec) PER_CPU_DEF_ATTRIBUTES \
__typeof__(type) name
#endif
看最后一行,最终也就是定义了一个type类型,名字是name的变量。感觉和普通的变量没有什么区别。那区别在哪里呢?对了,就在上面那个宏里面。
__PCPU_ATTRS
#define __PCPU_ATTRS(sec) \
__percpu __attribute__((section(PER_CPU_BASE_SECTION sec))) \
PER_CPU_ATTRIBUTES
#define