http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.87.3870&rep=rep1&type=pdf
沿着lock free的reference,找到Magged M Michael的2004年这篇文章。
文章主要和ptmalloc和hoard做对比。那种每个线程完全独立分配的分配器被认为是不成熟的,不值一提的(因为使用空间可能会非常大)。ptmalloc是在doug lea的dlmalloc基础上做的,有多个areana减少竞争,当发现一个areana上锁时就寻找下一个areana,这样锁的粒度只在每个areana。
hoard里每个处理器有专门的heap,如果某个heap富余空间较大会被移到global heap中,仍然需要用锁。
每个heap下面有多个super block,从super block中分配内存,但都通过CAS操作做到lock free,里面还有类似ibm tag mechnism这样的技术,细节的没有仔细研究,大体如此。
有很多美妙特性:高扩展性、死锁免疫、Async-signal-safe等等,各个benchmark碾压hoard和ptmalloc。
问题来了,这篇文章是04年的,市面上出现了很多新的内存分配器zmalloc,tcmalloc,jemalloc这些,使用的原理是否和论文中一样,性能对比呢?