论文阅读-Black-box Concurrent Data Structures for NUMA Architectures

最新推荐文章于 2024-07-10 22:49:54 发布

凉亭_pavilion

最新推荐文章于 2024-07-10 22:49:54 发布

阅读量218

点赞数 1

分类专栏： linux 杂记文章标签：开发语言 structure c++ linux ieee论文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ltuse_csdn/article/details/121165361

版权

linux 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

Black-box Concurrent Data Structures for NUMA Architectures

背景

当前高性能服务器都是NUMA机器

全局数据时常需要在不同线程或者说numa节点中进行共享。比如操作系统中的内存管理的数据，多核应用的全局数据等。这些数据都需要较好的并行性支持（Concurrent data structure）。

关键在于更好的扩展性和并行性，与编程难度之间的平衡

相关工作

•锁或者cas等方式来自己写，自由度很高但是对NUMA并不敏感，这将可能损害整体的性能

•已有的black-box方法，如Flat combining (w/o RWL)，他们并不是为NUMA开发，仍然容易受到NUMA结构的影响而损失性能。

•NUMA-aware algorithm, 针对特定数据结构开发，不通用而且很少。

设计

•提出了一种能够适应NUMA结构的黑箱算法，能够比较方便地实现数据结构的并行，并获得很好的性能。

参考分布式系统：每个节点实现一个数据备份（replica），使用一个共享的日志来进行同步

参考共享内存算法：采取层次化的numa感知设计实现的日志来实现可序列化级别的一致性

结构

需要数据结构提供接口，然后就能够比较方便的使用他的算法，得到一致性。

Create将产生一个这个数据结构的实例。

而Execute将执行对传入的数据实例（ptr）执行操作（op，如push， pop等），可以参数（args）。

IsReadOnly则用来判断一个操作是不是只读的。

然后当我们想要修改这个数据实例的时候调用他们提供的ExecuteConcurrent来代替Execute就可以了。

节点内部一致性

•执行者（ combiner 整合者？），每个节点同一时间都只有一个线程能够成为执行者，而只有执行者才能执行修改日志和备份的操作。获得锁并写玩日志后会获取节点内写者锁。

•写操作会首先把操作和参数存放到当前cpu对应的一个预留位置。执行者获取当前的所有待执行任务，记录到日志中，并把日志依次执行，直到当前任务完成。

节点间一致性

•按照日志顺序执行每个日志项的操作。

•用写操作进入日志的时候，日志的末尾的位置作为这个操作执行的时间顺序。

•如果说在执行过程中日志中有新的写入，那也认为那是“未来”的事情。

只读优化

•只读操作的并行

•读操作则尝试把他当作写操作执行（避免空等写操作到来）

•不然就等日志执行到进入函数的位置，尝试获取读者锁执行。

•主要不同在于使用的是进入函数时，日志第一条未被执行的日志的位置completedTail作为读操作的“发生时间”。只要当前备份更新到超过这个时间就算足够新了。

•这个操作主要是因为读操作不会留在日志中，需要一个位置来作为操作发生时间，保证可序列化。而他只要保证所读的是进入函数时，所有备份中最新的那份（>completedTail，认为足够新）。

•更新的时候一次更新一批待执行日志，但不会坚持去执行完所有日志。

算法

数据结构

全局

•日志shareLog

•日志记录下标logTail，表示当前最后写的位置

•日志第一个未执行的位置completedTail

每个节点一个

•数据备份

•下标logTail，表示当前备份执行到日志的位置

•整合锁，每个节点一个，获取到就去整合（执行日志，执行excute操作），不然就等其他人做完就行。

•读写锁，执行前需要根据类型获取。Excute需要写锁，不然读锁就行

每个cpu核心

•Slot 和response，用来存储当前任务和结果

逻辑

执行excute的时候，

首先判断操作是否只读，是则记录当前全局最新备份的版本comletedTail，等待或成为执行者更新当前备份版本localTail到足够新的版本。

然后尝试获取读者锁，然后执行，释放锁。

如果是执行操作，

1.记录当前操作到指定区域。

2.尝试获取执行者锁，成为执行者。或者是等别人执行完。

3.搜集所有线程的待执行任务，写到日志中，

4.获取写者锁，更新当前备份版本，如果当前版本为全局最新则尝试更新全局最新为当前版本。

5.执行所收集的所有任务。

6.释放所有锁

优化细节

优化

•改进分布式读写锁

•每个cpu有一个锁（称为读者锁），写者锁就是要获取所有的读者锁。

•改进为：有一个写者锁，写者去获取这个锁，然后等所有读者锁释放即可。释放的时候释放这个写者锁即可。读者获取锁的时候，先等待写者锁释放，然后获取读者锁，再检查一次写者锁。被锁则释放，否则开始使用。这样的话，读者写者都只要进行一次原子写就可以了。而因为写者只会有一个且很多工作在非关键区（写日志），不会导致读者饥饿的情况。

•循环日志队列

•对架构的优化-比如对齐之类的

具体可能遇到的问题

•线程数量，允许比核数更多的线程，形成更大的批处理，提高效率。

•日志长度，或许可以动态扩展，但是并没有。实际是一个1M容量的循环队列。

•近cpu申请内存。

•有时候可能某个节点长时间没更新，导致日志爆满。设定一个线程，定时执行下一次。但是一般应用不需要这个。

•多种数据结构混合。可以组合成一个包含他们的数据结构。

结果

常用数据结构测试

•基本上都取得最好的效果。

•以Skip list priority queue为例

•在无更新操作的时候，LF没有锁开销一枝独秀，NR，FC+以及RWL都采用RWL差在需要获取锁的开销，而NR则进一步需要检查日志，是不是最新备份。

•10%更新的时候，大家都会受到NUMA的影响而性能下降。但NR在线程超过一个节点（28个超线程）的时候性能损失更少。比其他方法好1.7x-41x

•在需要一直更新的时候，大家的性能损失都相当严重。不过同样，NR损失更少。2.4x-9.4x。

•每次读写的时候在这个数据结构外围写e个随机位置的时候，SL就没有这个效果了。解释是可以造成cache污染的效果。

•但一些特定的结构，如栈，在NA使用特定技术消元（elimination）来优化的情况下能够比NR好很多之外。（取得几乎是线性的扩展能力）

其他并行数据结构对比扩展性

•数据结构：一个简单的n=200K个元素的buffer，每个操作会访问其中固定的一个元素（模拟指针，比如树的根之类的角色），然后剩余的（C-1 = 7）个元素则是均匀随机地访问。

•可以看到，核数比较少地时候，还有FC，FC+，RWL可以稍微跟NR相比，但是在线程数逐渐增大，NR的表现会逐渐地变得突出。在10%更新的情况下能达到4x的加速

实际应用测试

•实际应用redis测试

•读写混合的YCSB benchmark来做测试

•先创建一个10000个元素的排序集。用多个线程不断地对他进行读或更新随机（均匀分布）个元素。

•可以看到较低更新率的时候，NR的吞吐率都是最高的。能够获得2.6x-14x的加速比。

而较高更新率的时候，NR的性能也几乎没有损失。能够获得1.1x-4.4x的加速比

优化选项效果

•每个改进的效果，可以看到

•#4并行更新备份（如果让所有）有效改进跨node读写的时候的性能

•#1和#5的改进有效的改进节点内的效果。

•#3中可以看到允许读者在执行者写日志的时候工作的能有比较好的效果。

参考资料

Black-box Concurrent Data Structures for NUMA Architectures

凉亭_pavilion

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
论文阅读-Black-box Concurrent Data Structures for NUMA Architectures

全局数据时常需要在不同线程或者说numa节点中进行共享。比如操作系统中的内存管理的数据，多核应用的全局数据等。这些数据都需要较好的并行性支持（Concurrent data structure）。提出了一种能够适应NUMA结构的黑箱算法，能够比较方便地实现数据结构的并行，并获得很好的性能。
复制链接

扫一扫

专栏目录

凉亭_pavilion CSDN认证博客专家 CSDN认证企业博客

码龄8年

11: 原创

108万+: 周排名

13万+: 总排名

1万+: 访问

: 等级

215: 积分

26: 粉丝

45: 获赞

11: 评论

43: 收藏

私信

关注

热门文章

分类专栏

linux 6篇
rdma 1篇
杂记 2篇

最新评论

sqlite3 学习-实例-笔记
CSDN-Ada助手: 恭喜你写了第9篇博客！看到你在学习sqlite3并分享实例和笔记，我感到非常欣慰。你的博客内容非常有价值，不仅可以帮助他人学习sqlite3，也能记录下你自己的学习过程。希望你能继续保持创作的热情，不断分享自己的学习心得和经验。同时，我建议你在未来的创作中，可以尝试结合更多的实际案例和应用场景，这样能让读者更容易理解和应用所学知识。加油！
openssl加密套件-学习-实例-笔记
CSDN-Ada助手: 恭喜您写了第10篇博客！看到您对openssl加密套件的学习和实例笔记，我感到非常欣慰。希望您能继续保持创作的热情，分享更多关于加密套件的知识和实践经验。或许下一步可以考虑添加一些实际应用案例或者深入解析某个特定功能，这样可以让读者更好地理解和应用所学知识。期待您的下一篇作品！加油！
socket 学习使用笔记
CSDN-Ada助手: 恭喜您撰写了第11篇博客“socket 学习使用笔记”！持续创作是提升自己的最佳途径，您的努力和坚持让我深感钦佩。接下来，我建议您可以尝试拓展一些实战案例，通过实际操作来巩固所学知识，相信这样会更有助于您的学习和成长。期待您更多精彩的文章，加油！
论文阅读-Black-box Concurrent Data Structures for NUMA Architectures
CSDN-Ada助手: 非常感谢您分享这篇关于Black-box Concurrent Data Structures for NUMA Architectures的论文阅读，我认为您可以继续探讨NUMA架构下的并发数据结构的实现和优化方法，或者深入研究其他相关的多线程编程技术，比如锁、原子操作等。相信这样的技术文章对其他用户的学习和实践都非常有帮助，期待您的下一篇博客。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
离散数学 p313 所有顶点都是偶度数的连通图有欧拉回路证明
Amazing_^: hhhh,好吧

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。