1、什么是CPU上下文切换(Context Switches)?
操作系统可以同时运行多个进程, 然而一颗CPU同时只能执行一项任务,操作系统利用时间片轮转的方式,让用户感觉这些任务正在同时进行。 CPU给每个任务都服务一定的时间, 然后把当前任务的状态保存下来, 在加载下一任务的状态后, 继续服务下一任务。任务的状态保存及再加载, 这段过程就叫做上下文切换。
Context Switches 上下文切换,有时也被称为进程切换(process switch)或任务切换。是一个重要的性能指标。
时间片轮转的方式使多个任务在同一颗CPU上执行变成了可能, 但同时也带来了保存现场和加载现场的直接消耗。
CPU从一个线程切换到另外一个线程,需要保存当前任务的运行环境,恢复将要运行任务的运行环境,必然带来性能消耗。
2、如何获得上下文切换的次数?( 性能分析查看Context Switches的方法)
Linux中可以通过工具vmstat, dstat, pidstat来观察CS的切换情况。vmstat, dstat只能观察整个系统的切换情况,而pidstat可以更精确地观察某个进程的上下文切换情况。
windows中可以使用查看进程的神器processxp,进程列表中可以添加Context Switchs和Context Switchs Delta列,另外进程属性Threads标签页可查看线程对应的Context Switchs。
另windows中还可以使用“性能计数器”监控Context Switchs的变化趋势,方便性能分析。添加System\Context Switches/sec或Thread(_Total)\Context Switches/sec计数器即可。
示例如下:vmstat直接运行即可,在最后几列,有CPU的context switch次数。 这个是系统层面的,加入想看特定进程的情况,可以使用pidstat。
执行pidstat,将输出系统启动后所有活动进程的cpu统计信息:
2020年07月21日:pidstat获取信息时间点
PID: 进程pid
%usr: 进程在用户态运行所占cpu时间比率
%system: 进程在内核态运行所占cpu时间比率
%CPU: 进程运行所占cpu时间比率
CPU: 指示进程在哪个核运行
Command: 拉起进程对应的命令
备注:执行pidstat默认输出信息为系统启动后到执行时间点的统计信息,因而即使当前某进程的cpu占用率很高,输出中的值有可能仍为 0。
3、上下文切换的性能消耗
Context Switchs过高,导致CPU就像个搬运工一样,频繁在寄存器(CPU Register)和运行队列(run queue)之间奔波,系统更多的时间都花费在线程切换上,而不是花在真正做有用工作的线程上。
直接消耗包括: CPU寄存器需要保存和加载, 系统调度器的代码需要执行, TLB实例需要重新加载, CPU 的pipeline需要刷掉。
间接消耗:多核的cache之间得共享数据。间接消耗对于程序的影响要看线程工作区操作数据的大小。
Linux相比与其他操作系统(包括其他类 Unix 系统)有很多的优点,其中有一项就是,其上下文切换和模式切换的时间消耗非常少。
4、引起上下文切换的原因
对于我们经常使用的抢占式操作系统来说, 引起上下文切换的原因大概有以下几种:
1. 当前执行任务的时间片用完之后, 系统CPU正常调度下一个任务
2. 当前执行任务碰到IO阻塞, 调度器将挂起此任务, 继续下一任务
3. 多个任务抢占锁资源, 当前任务没有抢到,被调度器挂起, 继续下一任务
4. 用户代码挂起当前任务, 让出CPU时间
5. 硬件中断,(如键盘、鼠标、调试解调器、系统时钟)