linux内核之RCU机制-初识篇

甜航一直在

已于 2024-08-08 10:00:17 修改

阅读量730

点赞数 18

分类专栏： linux内核文章标签： linux 运维服务器笔记

于 2024-08-08 09:58:58 首次发布

本文链接：https://blog.csdn.net/qq_37631068/article/details/141016582

版权

linux内核专栏收录该内容

5 篇文章 0 订阅

订阅专栏

简介

RCU（Read-Copy-Update）是一种用于多处理器环境下的并发控制机制，主要用于Linux内核和其他实时操作系统中，它的主要目的是减少读取操作时的延迟，提高系统的可扩展性。与传统的锁机制相比，RCU允许读取操作在无锁的情况下进行，从而提高了读取密集型工作负载的性能。

RCU（Read-Copy-Update），是Linux内核重要的同步机制。Linux内核有原子操作，读写信号量，为什么要单独设计一个比较复杂的新机制呢？

spinlock和mutex信号量都使用了原子操作，多CPU在访问共享变量的时候Cache一致性会变得非常糟糕，有时候会使得整个性能下降。
允许多个读者存在，但是读和写不能同时存在。
RCU让读者没有或者让同步开销变得更小，不需要锁和原子操作指令。将需要同步的任务交给写线程，等读者线程读完再更新数据。
在RCU机制中如果有多个写的存在，需要额外的保护机制。

原理

RCU的核心思想是在读取操作时不加锁，而是在更新数据结构时使用一种特殊的机制来确保一致性。具体来说，当有线程想要修改某个数据结构时，它首先创建该数据结构的一个副本（Copy），然后在这个副本上进行更新操作。一旦更新完成，新的版本将被标记为最新版本，而旧版本仍然可供那些正在读取的线程使用，直到它们完成读取操作后都离开临界区后，指针指向最新版本的指针，并且删除旧版本。由于读取操作是在旧版本上进行的，因此不需要加锁，这极大地减少了读取操作的延迟。

RCU的关键组件

RCU机制包含以下几个关键组件：

Readers (读取者): 执行读取操作的线程。在RCU中，读取者可以自由读取数据，而不必等待写入操作完成。
Updaters (更新者): 执行写入或更新操作的线程。更新者需要先创建数据的副本，然后在副本上进行修改，然后发布新版本替换旧版本。
Quiescent State (静默状态): 这是一个关键的概念，表示所有可能的读取者都已经完成了对旧版本的访问，此时更新者可以安全地回收旧版本的内存。

RCU的实现步骤

为了实现上述机制，RCU使用了一种称为“延迟回收”的策略。当更新者想要替换旧版本时，它不会立即回收旧版本的内存，而是将旧版本标记为待回收，并等待所有可能的读取者进入下一个“静默状态”。在静默状态下，任何正在进行的读取操作都已经完成，而且没有新的读取操作开始，这时更新者才能安全地回收旧版本的内存。

RCU的实现涉及以下几个关键步骤：

读取操作: 当线程进行读取操作时，它访问的是数据的当前版本。由于读取操作不持有任何锁，所以它可以立即完成，而不会受到写入操作的影响。
写入操作: 当线程想要修改数据时，它首先创建数据的副本（Copy），然后在这个副本上进行更新操作。一旦更新完成，这个新的版本被标记为最新版本。
发布新版本: 更新者不会立即回收旧版本的内存，而是将其标记为可被回收的状态。这是因为可能存在正在读取旧版本的线程。更新者需要等待所有可能的读取者进入“静默状态”。
静默状态: 静默状态是指所有可能的读取者已经完成了对旧版本的读取，并且没有任何新的读取者开始读取旧版本的时间点。这是通过一个称为“栅栏”（barrier）的同步原语来实现的，它可以确保所有的CPU都看到最新的数据版本。
回收旧版本: 当所有读取者都进入了静默状态后，旧版本的数据可以被安全地回收。RCU使用一种称为“延迟回收”的策略，这意味着旧版本的内存不是立即回收，而是延迟到所有可能的读取者完成读取后再进行回收。

RCU的优缺点

优点:
- 减少了读取操作的延迟，提高了读取密集型应用的性能。
- 无需频繁地加锁和解锁，降低了锁竞争带来的开销。
缺点:
- 写入操作的延迟可能会增加，因为写入者需要等待所有读取者完成读取。
- 实现复杂，需要精心设计和维护，以确保正确性和性能。
- 复制被修改的对象，写者之间必须使用锁互斥操作的方法。

RCU的实现细节

在Linux内核中，RCU的实现依赖于以下机制：

RCU读取屏障 (rcu_read_lock 和 rcu_read_unlock 或 rcu_read_lock_bh 和 rcu_read_unlock_bh): 这些函数用于标识读取操作的开始和结束。当读取操作开始时，调用rcu_read_lock函数，这会触发一个读取屏障，确保当前CPU看到的数据是最新的。当读取操作结束时，调用rcu_read_unlock函数。
RCU更新屏障 (call_rcu 和 synchronize_rcu): 这些函数用于处理写入操作。call_rcu函数用于安排一个回调函数，当所有读取者进入静默状态后，这个回调函数会被调用，用于清理和回收旧版本的数据。synchronize_rcu函数则用于阻塞当前线程，直到所有CPU上的读取操作都已完成并进入静默状态。

RCU机制的设计原则

只保护动态分配的数据结构，必须通过指针访问此数据结构；受RCU保护的临界区不能sleep；读写不对称，对写的性能没有要求，但是对读要求高。总结而言，RCU机制的设计哲学是优先保证读取操作的高性能和低延迟，而牺牲一部分写入操作的性能。通过这些特性，RCU能够在多处理器系统中有效地处理大量并发读取请求，同时确保数据的一致性和完整性。

注：临界区（Critical Section）是计算机科学中的一个概念，通常出现在多线程或并发编程的环境中。它指的是程序中的一段代码或者数据区域，这段代码需要在任何时刻只被一个执行线程访问或修改，以避免多个线程同时对共享资源进行操作而导致的数据不一致或其他错误。

在多线程编程中，当多个线程试图同时访问和修改同一个变量或数据结构时，如果没有适当的同步机制，就可能会产生竞态条件（Race Condition），导致不可预测的结果。为了避免这种情况，程序员会使用锁（Locks）、信号量（Semaphores）、互斥量（Mutexes）等同步原语来保护临界区，确保同一时刻只有一个线程能够进入临界区执行代码，其他线程必须等待直到临界区被释放。

例如，在银行账户转账的场景中，如果两个线程同时尝试从同一个账户中取款，而没有适当的同步措施，就可能导致账户余额计算错误。在这种情况下，处理账户余额增减的代码段就需要被视为临界区，并加以保护。

只保护动态分配的数据结构，必须通过指针访问此数据结构: RCU主要应用于动态数据结构，比如链表、树或者其他需要在运行时更改的数据结构。这是因为RCU机制的核心在于创建数据结构的副本以供更新，这通常适用于动态分配的对象。此外，RCU通常保护的是通过指针访问的数据结构，因为在更新过程中，新旧版本的数据结构通过指针切换，而指针本身是原子的，这样可以避免在读取操作期间锁定整个数据结构。
受RCU保护的临界区不能sleep: 在RCU中，读取操作必须是非阻塞的，这意味着在RCU读取屏障的保护下，读取操作不能执行任何可能引起阻塞的系统调用，比如sleep或I/O操作。这是因为如果读取操作阻塞，那么它就无法及时完成，从而延迟写入者回收旧版本数据结构的能力。为了保持RCU的性能和设计初衷，所有读取操作必须保证快速完成，不允许有睡眠或阻塞行为。
读写不对称，对写的性能没有要求，但是对读要求高: RCU机制的核心设计是优化读取操作的性能，而对写入操作的性能要求相对较低。这是因为RCU假设在大多数情况下，读取操作远比写入操作频繁。因此，RCU尽力减少读取操作的延迟和锁的竞争，即使这意味着写入操作可能需要更多的时间来完成，包括创建副本、等待所有读取操作完成以便安全回收旧数据等。这种不对称的设计使得RCU非常适合于读取密集型的工作负载。