CPU的亲和性

路飞H

已于 2023-09-23 14:11:23 修改

阅读量552

点赞数

分类专栏：基础组件专栏文章标签： linux

于 2023-09-17 12:34:39 首次发布

本文链接：https://blog.csdn.net/qq_29750559/article/details/132941281

版权

基础组件专栏专栏收录该内容

15 篇文章 1 订阅

订阅专栏

文章目录

前言

CPU领域中最广为人知的一条定律——摩尔定律：预计18个月会将芯片的性能提高一倍。过去几十年，各大公司致力于提高CPU晶体管密度和提高CPU工作频率，使得CPU的性能提升基本符合摩尔定律。但随着工艺不断发展，晶体管密度提升已经接近物理极限，CPU工作频率也由于功耗和发热的制约而无法继续提升。在基础物理领域没有大的突破的前提下，单核CPU的性能提升日益困难，于是，各大公司将目光投向了通过增加CPU核心数提高性能领域，双核、4核、8核、16核等一系列多核CPU相继问世。

怎样合理调度多个CPU核心运行应用程序从而充分利用多核CPU的优势成为热门的研究问题，本文介绍的CPU亲和性便是解决该问题的方法之一。

什么是CPU亲和性？

引用一下维基百科的说法，CPU亲和性就是绑定某一进程（或线程）到特定的CPU（或CPU集合），从而使得该进程（或线程）只能运行在绑定的CPU（或CPU集合）上。CPU亲和性利用了这样一个事实：进程上一次运行后的残余信息会保留在CPU的状态中（也就是指CPU的缓存）。如果下一次仍然将该进程调度到同一个CPU上，就能避免缓存未命中等对CPU处理性能不利的情况，从而使得进程的运行更加高效。

CPU亲和性分为两种：软亲和性和硬亲和性。软亲和性主要由操作系统来实现，Linux操作系统的调度器会倾向于保持一个进程不会频繁的在多个CPU之间迁移，通常情况下调度器都会根据各个CPU的负载情况合理地调度运行中的进程，以减轻繁忙CPU的压力，提高所有进程的整体性能。除此以外，Linux系统还提供了硬亲和性功能，即用户可以通过调用系统API实现自定义进程运行在哪个CPU上，从而满足特定进程的特殊性能需求。

如何将CPU亲和性应用到程序中

Linux系统中每个进程的task_struct结构中有一个cpus_allowed 位掩码，该掩码的位数与系统CPU核数相同（若CPU启用了超线程则为核数乘以2），通过修改该位掩码可以控制进程可运行在哪些特定CPU上。Linux系统为我们提供了CPU亲和性相关的调用函数和一些操作的宏定义，函数主要是下面两个：

sched_setaffinity() （修改位掩码）
sched_getaffinity() （查看当前的位掩码）

除此之外还提供了一些宏定义来修改掩码，如CPU_ZERO()(将位掩码全部设置为0)和CPU_SET()(设置特定掩码位为1)。

下面以一个4核CPU两个进程绑定在指定CPU上运行为例：


#define _GNU_SOURCE
#include <unistd.h>
#include <stdio.h>
#include <sys/types.h>
#include <sys/syscall.h>
#include <sched.h>

// nginx.conf --> set affinity 0000 0000,nginx配置文件中是可以配置的


//针对CPU的粘合，进程和线程都是可以粘合的
//这其实也是一种固定做法

void process_affinity(int num) {

	//下面两行都是同样的操作
	//gettid()
	pid_t self_id = syscall(__NR_gettid);	//__NR_gettid是一个系统调用号id，syscall通过调用一个id号触发的就是一个系统调用

	//cpu_set_t是一个集合,数量等于cpu的数量，CPU_ZERO是把cpu_set_t集合清空，
	//CPU_SET意思是将对应的哪一个cpu置1，sched_setaffinity意思是将对应的进程绑定在置1的CPU上运行
	cpu_set_t mask;
	CPU_ZERO(&mask);
	CPU_SET(self_id % num, &mask);

	sched_setaffinity(self_id, sizeof(mask), &mask);
	
	while(1);
}


int main() {
	//获取cpu的数量,sysconf是读取的配置文件，从而获取number
	int num = sysconf(_SC_NPROCESSORS_CONF);

	printf("num: %d\n", num);

	int i = 0;
	pid_t pid = 0;
		
	for (int i = 0; i < num/2; i++) {
		pid = fork();
		if (pid <= 0) {
			break;
		}
	}

	//走到这里说明有三个进程,其中有两个进程的pid=0
	if (pid == 0) {
		//将两个子进程绑定在指定CPU上
		process_affinity(num);
	}

	//主进程加一个while(1),usleep
	while(1) usleep(1);

}

我们使用ps -eo pid,ppid,args,psr | grep ./aff和htop命令发现，子进程31586跑在3号cpu上，子进程31587跑在4号cpu上，并且都跑满了。并且可知进程与CPU绑定成功，进程只会运行在绑定的CPU上而不会被操作系统调度到其他CPU上。

在这里插入图片描述

CPU亲和性的应用场景

假如某些进程需要高密度的计算，不希望被频繁调度，则可以使用CPU亲和性将该进程绑定到一个CPU上；
在股票期货高频交易场景中，交易策略线程的运行时间关系到交易延迟的大小，而交易延迟1ms的差距可能就是赚钱与亏钱的差距，所以交易策略线程的优先级非常高，这时便可以为其分配一个专门用于策略计算的CPU，以避免线程被调度产生性能损失；
高性能的Nginx采用多线程模型，并且提供了worker进程绑定固定CPU的功能，降低worker进程被调度的损耗，提高了服务器工作性能；
一些文献中还提到了应用CPU亲和性优化KVM虚拟化技术的性能，在不减少吞吐量的情况下，可以将KVM的网络延迟性能降低20%；

总结

一般情况下，Linux系统的进程调度器已经做得足够好，不需要我们干预进程的调度，但是系统的进程调度是面向所有应用程序的，势必会为了通用性而牺牲掉一部分性能，但对于特定应用程序而言，我们可以通过CPU亲和性去优化程序的性能表现。

我们相对于计算机的优势就是我们知道我们的程序的功能、每个进程的重要程度，所以可以根据进程的重要程度更合理的分配计算机的CPU资源。

路飞H

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CPU的亲和性

CPU领域中最广为人知的一条定律——摩尔定律：预计18个月会将芯片的性能提高一倍。过去几十年，各大公司致力于提高CPU晶体管密度和提高CPU工作频率，使得CPU的性能提升基本符合摩尔定律。但随着工艺不断发展，晶体管密度提升已经接近物理极限，CPU工作频率也由于功耗和发热的制约而无法继续提升。在基础物理领域没有大的突破的前提下，单核CPU的性能提升日益困难，于是，各大公司将目光投向了通过增加CPU核心数提高性能领域，双核、4核、8核、16核等一系列多核CPU相继问世。
复制链接

扫一扫