【Linux kernel/CPU idle】CPU Idle 初探

cpuidle framework

每一个 CPU 核心都会有一个 idle 进程,idle 进程是当系统没有调度 CPU 资源的时候,会进入 idle 进程,而 idle 进程的作用就是不使用 CPU,以此达到省电的目的。

在ARM64架构中,当CPU Idle时,会调用WFI指令(wait for interrupt),关掉CPU的Clock以便降低功耗,当有外设中断触发时,CPU又会恢复回来。
cpuidle core 是 cpuidle framework 的核心模块,负责抽象出 cpuidle device、cpuidle driver 和 cpuidle governor 三个实体,如下所示:
在这里插入图片描述

疑问:cpuidle governor作用是啥?

cpuidle core 抽象出了 cpuidle device、cpuidle driver 和 cpuidle governor 三个数据结构。

数据结构

cpuidle_device

针对每个CPU核都对应一个struct cpuidle_device结构,主要字段介绍如下:

struct cpuidle_device {
 //该cpu核是否注册进内核中
 unsigned int  registered:1;
 //该cpu核是否已经使能
 unsigned int  enabled:1;
 unsigned int  use_deepest_state:1; // cpu是否处于深睡标志?
 //对应的cpu number
 unsigned int  cpu;

 //该cpu核上一次停留在cpuidle状态的时间(us),为啥要统计这个时间?
 int   last_residency;
 //记录每个cpuidle状态的统计信息,包括是否使能、进入该cpuidle状态的次数,停留在该cpuidle状态的总时间(us)
 struct cpuidle_state_usage states_usage[CPUIDLE_STATE_MAX];
  ......
};

对应的注册接口是 cpuidle_register_device。

struct cpuidle_device {


};

cpuidle_driver

cpuidle driver用于驱动一个或多个CPU核,关键字段描述如下:

struct cpuidle_driver {
 const char  *name;
 struct module   *owner;
 int                     refcnt;

 //用于驱动注册时判断是否需要设置broadcast timer
 unsigned int            bctimer:1;
 //用于描述cpuidle的状态,需要按照功耗从大到小来排序,具体有多少个cpuidle状态
 struct cpuidle_state states[CPUIDLE_STATE_MAX];
	int			state_count;
	int			safe_state_index;

	/* the driver handles the cpus in cpumask */
	struct cpumask		*cpumask;

	/* preferred governor to switch at register time */
const char		*governor;
};
//CPU有多种不同的idle级别。这些idle级别有不同的功耗和延迟,从而可以在不同的场景下使用
//主要包括exit_latency、power_usage、target_residency。这些特性是governor制定idle策略的依据
struct cpuidle_state {
 char  name[CPUIDLE_NAME_LEN];
 char  desc[CPUIDLE_DESC_LEN];

 unsigned int flags;
 //CPU从该idle state下返回运行状态的延迟,单位为us。它决定了CPU在idle状态和run状态之间切换的效率,如果延迟过大,将会影响系统性能;
 unsigned int exit_latency; /* in US */
 //CPU在该idle state下的功耗,单位为mW
 int  power_usage; /* in mW */
 //期望的停留时间,单位为us。进入和退出idle state是需要消耗额外的能量的,如果在idle状态停留的时间过短,节省的功耗少于额外的消耗,则得不偿失。governor会根据该字段,结合当前的系统情况(如可以idle多久),选择idle level;
 unsigned int target_residency; /* in US */
 bool  disabled; /* disabled on all CPUs */

 //进入该state的回调函数
 int (*enter) (struct cpuidle_device *dev,
   struct cpuidle_driver *drv,
   int index);

 //CPU长时间不需要工作时(称作offline),可调用该回调函数。
 int (*enter_dead) (struct cpuidle_device *dev, int index);
  ......
};

对应的注册接口是 cpuidle_register_driver。

cpuidle_governor

governor 结构主要提供不同的回调函数,最终由 menu_governor 填充,主要字段如下:

struct cpuidle_governor {
 char   name[CPUIDLE_NAME_LEN];
 struct list_head  governor_list;
 //governor的级别,正常情况下,kernel会选择系统中rating值最大的governor作为当前governor
 unsigned int  rating;

  //在设备驱动注册和注销的时候调用
 int  (*enable)  (struct cpuidle_driver *drv,
     struct cpuidle_device *dev);
 void (*disable)  (struct cpuidle_driver *drv,
     struct cpuidle_device *dev);

 //根据当前系统的运行状况,以及各个idle state的特性,选择一个state(即决策)
 int  (*select)  (struct cpuidle_driver *drv,
     struct cpuidle_device *dev,
     bool *stop_tick);
 //通过该回调函数,可以告知governor,系统上一次所处的idle state是哪个
 void (*reflect)  (struct cpuidle_device *dev, int index);
};

对应的注册接口是 cpuidle_register_governor。

流程

我们先看下设备和驱动的注册过程:
注册之后便将设备和驱动建立起连接关系了,最终 cpuidle framework 的用户便可通过接口来调用下层的接口,进而完成具体的硬件操作。
在这里插入图片描述
下面看下 CPU 进入 idle 状态的流程图:

在这里插入图片描述
可以看出,最终是通过 PSCI 来实现 CPU 的 suspend。

PSCI

PSCI, Power State Coordination Interface,由ARM定义的电源管理接口规范,通常由Firmware来实现,而Linux系统可以通过smc/hvc指令来进入不同的Exception Level,进而调用对应的实现。
在这里插入图片描述
PSCI 支持如下功能:

CPU hotplug (on/off)
CPU idle (suspend/resume)
System suspend/resume
System shutdown and reset
每个功能和ATF之间的调用接口如下所示:
在这里插入图片描述

学习wiki:
CPU 进入 IDLE 都做了啥?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值