典型的应用程序都只使用了一个CPU,有多个CPU的时候如何进行多处理器调度?
背景
缓存:很小很快的存储设备。
程序第一次读取数据时,数据在内存中,因此需要花费较长的时间(可能数十或数百ns)。处理器判断该数据很可能会被再次使用,因此将其放入 CPU 缓存中。如果之后程序再次需要使用同样的数据,CPU 会先查找缓存。因为在缓存中找到了数据,所以取数据快得多(比如几纳秒),程序也就运行更快。
缓存一致性问题
此问题讲的就是多个CPU共享一个内存,但缓存不共享,可能导致CPU1修改内存中的值暂存于缓存1中,而CPU2没有及时更新的情况。
解决办法:
硬件:
监控内存访问(例如总线窥探(bus snooping))
程序:
使用互斥原语(比如加锁(locking))
缓存亲和度问题
进程在一个CPU上运行时会在其缓存维护许多状态,从而保证下次在同一CPU运行时更快,然而,在不同CPU上运行需要重新加载数据而很慢。
解决办法:
调度时尽可能将进程保持在同一CPU上。
调度程序
单队列调度(Single Queue Multiprocessor Scheduling,SQMS)
把所有工作放到一个队列中
短板:
(1) 缺乏可扩展性
因为需要加锁保证每个工作的原子性。
(2) 缓存亲和性差
显然,一个工作不能多个CPU同时运行,所以CPU会频繁切换工作。
针对(2)的优化:
牺牲其他工作亲和度实现负载均衡:
多队列调度(Multi-Queue Multiprocessor Scheduling)
优势:
(1) 具有可扩展性
(2) 具有良好的缓存亲和度
负载不均问题
多队列调度时,可能一个CPU上的工作都执行完了,其他CPU还一个都没完成,导致不同CPU负载不均衡。
解决办法:迁移(migration)
不断迁移一个或多个工作到其他CPU上。
何时发起迁移请求?
工作窃取(work stealing):工作量较少的队列不定时”偷看“其他队列是不是工作比自己多,如果是,就“窃取”工作。
但是,频繁检查会导致开销较高,间隔太长又会导致负载不均,找到合适的阈值很重要!
Linux多处理器调度
未统一
O(1)调度程序、完全公平调度程序(CFS)以及 BF 调度程序(BFS)。
O(1) CFS 采用多队列,而 BFS 采用单队列。
O(1)调度程序是基于优先级。
CFS是确定的比例调度方法。
BFS也基于比例调度。