论文分享：Smartlocks: Lock Acquisition Scheduling for Self-Aware Synchronization

最新推荐文章于 2022-12-02 15:46:51 发布

He11o_Liu

最新推荐文章于 2022-12-02 15:46:51 发布

阅读量472

点赞数 1

分类专栏：算法阅读笔记多核同步文章标签：多核同步锁

本文链接：https://blog.csdn.net/he11o_liu/article/details/81077695

版权

针对非对称的处理器，也就是performance asymmetry（除了本身设定的如大小核心的异构系统，还有如过热降频等情况），在性能层面上讨论多核同步的可提升空间。（应该没涉及到能效层面，读完了看看能效层面能不能测试一下）

主要通过释放锁时对下一个获得者的选择来改善性能。笼统地来说就是Lock scheduling，获取锁的顺序，找到一个符合当前架构特点下性能表现最优的处理序列。

下图为理论的提升空间，由于memory system的限制，acquire和release在slow和fast的核上消耗的时间相同（更详细的解释？），提升空间和之前像的差不多，调整运行临界区的次序后可以提高吞吐率。

（但是他没有做migration到fast的核心试试）

这里写图片描述

针对smartlocks的核心思路，即选择下一个获得者，有几个问题：

第一个Evaluation时做的过热降频如何用application heartbeat monitor system来模拟的？能否有方法创造过热降频的环境？

粗略看了一下这篇paper，还比较有意思，说是比perf更好的profile应用的工具，可以看一下能不能用。

但是针对过热降频这个场景，可能并不是非常有说服力。实际的数据中心应该不会频繁产生过热降频这个问题。
第二个Evaluation说的利用cpufrequtils来控制各个核心的频率在实验室的ts850上是否还可行？

可行！居然可以控制每个核心运行的频率。cpufrequtils不行，但是可以自己暴力改cpufreq子系统来调整频率。已经验证并开始下一步计划
ML的engine得出来的结果能否简单的理解是，频率更高的核心直接赋予其更高的频率？能否不使用增强学习直接根据一段时间的performance来给priority，或者是fetch到当时的core frequency后根据frequency归类的到相应的priority level？ML engine的意义是什么？

smartlocks说提供源码，comingsoon了六年github的repo还是empty的。不是很好复现……

这里写图片描述

Smartlock采用独立的Helper thread来获取当前的环境信息，可以跑在单独的一个核心上，也可以和其他应用共用核心（不会导致等待切到helper才能继续的情况吗）
一个Helper thread可能采用RR的策略来服务所有的Smartlock。
每个需要调用Smartlock的thread都会有一个Smartlock Node，Smartlock Node用于与其他Smartlock Node协作，共同完成Smartlock的scheduling。
每个application对应一个Heartbeat object，对应一个或多个Smartlock。每个Smartlock如上图(a)