PACTree: A High Performance Persistent Range Index Using PAC Guidelines

Title: < PACTree: A High Performance Persistent Range
Index Using PAC Guidelines
>

Source: <SOSP ’21, October 26–29, 2021, Virtual Event, Germany >

School:


Summary

  • What is the problem the paper aims to solve?
    本文主要解决问题:NVM和DRAM之间有很多不同的特性,适用于DRAM上的索引也许并不适用于NVM。NUMA架构对于NVM上的影响比在DRAM上更加深远。

  • How can the paper address the problem? What is the main idea of this paper?
    这个论文主要做了两个工作,第一个是提出了在NVM上设计索引的指导方针,第二个是提出了基于他们的指导方针的树形索引PacTree。

  • Validations 验证

本文首先根据两条基本原则提出了多个指导方针,这两个基本原则是:
(1)用压在一起的方式(packed)去访问NVM硬件,以达到最小化其带宽利用率的目的
(2)利用异步和并发的控制,将NVM延迟较高的操作从一些关键步骤中解耦出来。
本文提出了一个NVM索引,技术特点是:
(1)用trie树作为索引的搜索层,用B+树的叶子结点作为存储数据的数据层,并将各个结点通过双向链表链接起来。该索引结构是一个全NVM的结构
(2)并发控制机制:ROWEX。这种机制可以实现排它写和非阻塞读
(3)数据选择性持久化
(4)NUMA感知
(5)记录排序序列来加速范围查询的过程
(6)异步更新的策略,当数据层的节点发生分裂或者merge的时候,使用log来更新搜索层的trie


Strengthens

Summarize the advantages of the paper in bullets.
这篇文章的主要优势在于
(1)利用了trie结构的读的次数比传统的B+树少,减少读带宽
(2)采用异步更新的策略,将NVM延迟比较高的操作解耦
(3)NUMA感知,对于每一个搜索层和数据层和log都单独建立NVM池,提高局部性。减少跨NUMA的访问。


Weaknesses

Give a brief summarization of disadvantages (that can have been mentioned in the Summary part) in bullets. Do not trust papers in total, and use critical thinking (note that this is the most important skill in academic research; try to train this capability) to find shadow sides.
(1)搜索层的trie有可能不平衡,键值对可能分布不均匀
(2)并发控制使用的乐观锁适用场景是读多写少的场景,如果是写多,读进程可能会一直retry
(3) 还是没有利用NVM顺序写快的优势


Comments

Give more detailed elaboration for each weakness point, and convince that why it is a weakness; if possible, try to give some fixing solution/suggestion. You can also pose some questions in this part.
(1)trie由于key的分布的不平衡可能会出现树不平衡的情况,这可能导致某些key的搜索路径很长,可以建多棵树,并且限制树的层数,
(2)和索引的应用场景有关。
(3)是不是可以借鉴append only的方式?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值