《c++并发编程》中无锁栈的实现为什么要用双引用计数器

最新推荐文章于 2024-10-14 17:54:02 发布

?-ldl

最新推荐文章于 2024-10-14 17:54:02 发布

阅读量731

点赞数 24

文章标签： c++

本文链接：https://blog.csdn.net/ld_long/article/details/137692475

版权

背景

《c++并发编程》中，实现无锁栈用了引用计数技术。原因是，pop方法要删除栈顶中的节点，然而，由于1.读取栈顶指针->2.根据栈顶指针访问栈顶节点、获取栈顶节点所保存的数据以及下一个节点指针next_node->3.更新栈顶指针为next_node->4.删除栈顶节点这4个步骤不能做到原子，所以可能出现下面情况，线程A执行完步骤1后，在执行步骤2之前，线程B一口气执行完步骤1-4，把节点删除了，然后线程A执行步骤2，就是一个空悬指针解引用的错误，因为线程A并不知道他要访问的节点，已经被线程B删除了。为了不让这中情况发生，需要使用引用计数技术，每有一个指针指向一个某个对象，这个对象的引用计数就+1。当指向一个对象的指针不再指向它时，它的引用计数就-1。当它的引用计数减少为0时，把他减为0的线程，要负责删除这个节点。所以，只要还有一个指针在指涉一个对象，这个对象就不会被删除。换句话说，就是让线程B知道线程A中有一个指针在指向它所弹出的节点，使得他不执行步骤4。

在《c++并发编程》实现引用计数用了两个计数器，一个计数器在节点内部，成为内部计数器。一个被称为外部计数器的计数器与指针绑定成结构体counted_node_ptr。栈顶指针的类型从原生指针修改为counted_node_ptr。每当有线程通过载入head指针，外部计数器+1。每当线程不再有指涉某个节点的指针，内部计数器-1，内部计数器+外部计数器=节点的实际引用计数，当它为0时，删除节点，数据结构如下图。（上上句话就是我写这篇博客的原因，我花了好长时间才想通为什么要这么做，为什么要搞内外引用计数器，为什么不合并每个计数器，后面我会讲，但现在，先让我把书本的做法介绍完）
在这里插入图片描述
当有线程要弹出数据时，它首先读取head指针（栈顶指针），存到线程局部变量local_head中并让head中的外部计数器+1，这个过程可以做到原子，接着它让local_head的计数器也变为和head中的计数器一样。然后，它通过local_head访问节点。如果它不能弹出节点（判定条件是：local_head与head不相同，也即有其他线程在本线程把head载入到local_head之后，修改了head指针），本线程载入的local_head作废），就把节点的内部计数器-1(本线程马上就不会指向这个节点的指针了）。如果节点的内部计数器因此变为了0（也即他原本为1）,则本线程删除这个节点。否则，啥也不做（此时内部计数器可能为负数）。如果它能够弹出数据（判定条件是：old_head仍然与head相同，也即没有其他线程在本线程把head载入到local_head之后，修改head指针），则它把head指针修改为head.ptr->next。注意，判定并修改可以做到原子。然后，local_head的外部计数器-1（因为head指针已经不在指向这个节点)，再让local_head的外部计数器-1(因为 local_head也准备不指向这个节点了,实际写代码时，让local_head减2就行，我分开讲是为了说清楚减的2是哪两个1)。然后，把local_head的计数器的值加到内部计数器。如果内部计数器因此变为0，也即他原本为local_head的外部计数器的相反数。则本线程负责把节点删除，否则，不删除节点。

为什么要两个计数器，一个可以吗？

如果一个可以，那考虑这个计数器放再哪里。放在节点内部吗？不行，因为计数器是为了解决空悬指针解引用，如果他放在节点内部，那访问计数器必须先访问节点。考虑下面场景：线程A读取head指针，存到local_head中，还没来得及通过local_head访问节点内部的引用计数器，让他加1,线程B率先访问到了节点引用计数器，让计数器+1。然后弹出节点，退出前，让计数器-1。发现计数器因此变成了0。删除节点。然后线程A才开始通过local_head访问节点内部引用计数器并试图让节点内部计数器+1。但是，节点已经被删除了，又出现了空悬指针解引用。所以，如果一个计数器可行，它只能在节点外面。那放在哪里呢？这个计数器需要让所有线程都能直接访问到（节点不属于所有线程能直接访问到的数据，它只能通过head指针间接访问）。它应该和head指针（所有线程都能直接访问）有相同的地位。参考外部指针，把计数器和head指针合2为1使得读head指针和计数器+1有机会原子进行（否则，读head指针和让计数器+1必定有时间间隙，不可能原子进行，因为他们属于两个不同的变量）。只有一个计数器，那么理论很直观。每有一个指向head节点的指针，就让计数器+1，当指针不再指向这个节点时，让它-1。理想很美好，现实怎么实现呢？
看看下面步骤
线程A载入head 到 local_head(类型为counted_node_ptr)。如果head没有变化，就让head的计数器+1。然后local_head也加1，此时他们head和local_head的计数器都为2。这些步骤都发生在访问节点之前，如果本线程确实要访问local_head指向的节点，由于计数器变为了2，所以节点肯定不会被删除。它之后可以安全地访问local_head指向的节点。但它还没来得及访问，线程B这时候载入head到local_head中，并让head计数器和local_head计数器都变为了3。（它看到head指针为3，就知道，此时除了它自己，还有另一个线程在访问head节点。），它把head指针修改为了head.ptr->next。这时候，head的计数器变为了1，因此此时head指针指向的对象改变了，而那个对象目前只有head指针一个指针在指向它。线程B检查local_head的计数器，让local_head的计数器-2。也即让local_head的计数器变为了1。由于计数器不为0，所以它没有删除节点。它完成了巩工作，pop函数退出。此时线程A安全地访问它的local_head所指向的节点，发现local_head和head已经不一样，所有它放弃弹出这节点。它让local_head的计数器-1，使得local_head的计数器变为了1，由于不为0，所以没有删除节点。这样，这个节点永远都不会被删除了。问题出在哪里呢？计数器应该是节点关联的，它应该存在节点内部，一个节点应该只有一个计数器，但这里，我们无法把计数器放在节点的内部，而放在节点的外部，又需要和head指针拼在一起使得他们读head指针和让计数器+1能够原子进行。这样，就会产生多个计数器，head指针和每个进程各有一个计数器。每个线程让计数器-1,别的进程是不可见的。这就是问题所在。
所以，一个计数器是不行的，除非我们可以让所有的节点有且只有一个计数器，就像shared_ptr那样，可惜，shared_ptr无法做到和读head指针无锁但原子地进行。

双引用计数器的原理是什么

外部计数器：为了线程读读head指针时，知道除了它自己，还有几个线程和自己读取了相同的head。一个线程退出时，如果它修改了head指针它减去自己知道的有2个指针不再指向那个节点，得出一个值x。x就是在它的视角看来，他退出后，还有x个线程在指向这个节点，把这个值加上节点内部计数器，就像是通知这个节点，你的任务已经完成了，但是，由于在我看来，还有x个线程在指向你，除非他们都不再指向你了(内部计数器的值为外部计数器的值的相反数），否则我不能删除你。如果它没有修改head指针，它让节点内部计数器-1,就像告诉节点，我已经不再指向你了，如果你现在没有被其他人引用的话（内部计数器为1），我就删除你，否则，我只是通知你。你后面可以告诉别人我不再引用你了。
内部计数器：有多少个指针在引用自己。但更新滞后，并不是每有一个指针指向它，它就立刻更新。
外部计数器更新及时，但不为所有线程所见，内部计数器为所有线程所见，但更新不及时，他们按照协议相互配合，才能正确工作。