突破编程_C++_C++11新特性（多线程编程的原子操作（3））

最新推荐文章于 2024-07-26 21:35:32 发布

breakthrough_01

最新推荐文章于 2024-07-26 21:35:32 发布

阅读量425

点赞数 9

分类专栏：突破编程_C++_C++11新特性文章标签： c++

本文链接：https://blog.csdn.net/h8062651/article/details/137104109

版权

突破编程_C++_C++11新特性专栏收录该内容

29 篇文章 2 订阅

订阅专栏

1 原子操作的内存序

1.1 内存序的概念

原子操作（Atomic Operations）是并发编程中的一个重要概念，它指的是在多线程环境中，某些操作是不可中断的，即在执行完毕之前，不会被其他线程打断。在 C++11 中，标准库提供了 <atomic> 头文件，用于支持原子操作。原子操作在多线程编程中非常重要，因为它们可以用来实现无锁数据结构，提高程序的并发性能。

然而，仅仅提供原子操作并不足以保证并发程序的正确性。这是因为存在所谓的内存模型问题，即不同的线程可能会看到不同的内存状态，这可能导致程序的行为与预期不符。为了解决这个问题，C++11 引入了内存序（Memory Order）的概念。

内存序定义了多个线程之间内存访问操作的可见性和顺序性。它规定了编译器和处理器在优化代码时，对内存操作的重新排序的限制。通过指定不同的内存序，程序员可以控制线程之间的同步程度，从而平衡性能和正确性。

1.2 常见的内存序

C++11 中提供了以下几种内存序：

std::memory_order_relaxed：最宽松的内存序。它不对编译器和处理器对操作的重新排序施加任何限制。这种内存序通常用于不需要严格同步的场景，例如计数器。
std::memory_order_consume：这种内存序用于数据依赖关系。它保证了对一个原子变量的读取（load）之前所有对该变量的写入（store）操作对其他线程可见。这种内存序适用于依赖关系明确的场景（注意：该类型在 C++17 中已经被弃用）。
std::memory_order_acquire：这种内存序用于确保对原子变量的读取操作之前的所有普通内存操作对其他线程可见。它通常与 std::memory_order_release 配合使用，实现线程间的同步。
std::memory_order_release：这种内存序用于确保对原子变量的写入操作之后的所有普通内存操作对其他线程可见。它通常与 std::memory_order_acquire 配合使用，实现线程间的同步。
std::memory_order_seq_cst：最严格的内存序，它保证了所有线程都按照程序中的顺序看到内存操作。这种内存序提供了最强的同步保证，但也可能导致性能下降。

注意：在 C++11 中，对于原子操作，如果不显式指定内存序（memory order），那么默认的内存序类型是 std::memory_order_seq_cst，即顺序一致性内存序。这意味着，如果没有特别指定，原子操作将保证全局顺序一致性，即所有线程将看到操作以相同的顺序发生。

1.3 使用内存序的样例

std::atomic<int> count;  
  
// 使用std::memory_order_relaxed进行原子加法  
count.fetch_add(1, std::memory_order_relaxed);  
  
// 使用std::memory_order_acquire和std::memory_order_release进行线程同步  
count.store(0, std::memory_order_release);  
int value = count.load(std::memory_order_acquire);

注意事项

不同的内存序提供了不同程度的同步保证，同时也影响了程序的性能。因此，在选择内存序时需要根据具体的应用场景进行权衡。
错误的内存序选择可能导致数据竞争（Data Race）和其他并发问题，使程序的行为变得不可预测。
在某些情况下，编译器和处理器可能会对内存操作进行重排序以优化性能。使用正确的内存序可以确保这些优化不会破坏程序的正确性。

2 std::memory_order_relaxed

std::memory_order_relaxed 是最宽松的内存序，仅保证原子操作本身的原子性，而不对执行顺序做出任何保证。这意味着编译器和处理器可以自由地对其他非原子操作进行重排序。因此，std::memory_order_relaxed 通常用于不需要严格同步的场景，如计数器或性能敏感的应用中。

举个例子，假设有两个原子操作 A 和 B，分别在不同的线程中执行。如果这两个操作都使用了 std::memory_order_relaxed，那么编译器或处理器可能会选择先执行 A 再执行 B，或者先执行 B 再执行 A，或者甚至并行执行它们。这种灵活性可能导致一些难以预测的行为，特别是在多线程环境中。

应用场景

计数器：当需要一个计数器，且不关心计数操作的精确顺序时，可以使用std::memory_order_relaxed。
性能敏感的应用：在需要高性能且对内存序要求不高的场景中，std::memory_order_relaxed可以作为一种选择。

示例

下面是一个使用 std::memory_order_relaxed 的简单示例，它展示了如何在一个多线程环境中使用 std::atomic<int> 类型的计数器。

#include <iostream>  
#include <thread>  
#include <vector>  
#include <atomic>  
  
std::atomic<int> counter(0); // 初始化一个原子计数器  
  
void increment() {  
    for (int i = 0; i < 1000; ++i) {  
        counter.fetch_add(1, std::memory_order_relaxed); // 使用std::memory_order_relaxed进行原子加法  
    }  
}  
  
int main() {  
    const int num_threads = 10;  
    std::vector<std::thread> threads;  
  
    // 创建多个线程，每个线程都会增加计数器的值  
    for (int i = 0; i < num_threads; ++i) {  
        threads.emplace_back(increment);  
    }  
  
    // 等待所有线程完成  
    for (auto& thread : threads) {  
        thread.join();  
    }  
  
    std::cout << "Final counter value: " << counter << std::endl;  
  
    return 0;  
}

上面代码的输出为：

Final counter value: 10000

这个示例创建了10个线程，每个线程都使用std::memory_order_relaxed来增加计数器的值。由于使用了std::memory_order_relaxed，编译器和处理器可能会对其他非原子操作进行重排序，这可能导致计数器的最终值不是精确的10000（因为线程间的操作可能发生重叠），但这对于只需要大致计数的场景来说是可接受的。

计数器值可能不精确的原因主要有以下几点：

操作的重新排序：编译器和处理器为了优化性能，可能会重新安排非原子操作或原子操作的顺序。这意味着，尽管多个线程都在对计数器进行递增操作，但由于操作的重新排序，这些递增操作可能不会按照线程执行它们的顺序来执行。这可能导致计数器的最终值小于预期值。
同时读写冲突：在多线程环境中，当多个线程同时对计数器进行读写操作时，由于 std::memory_order_relaxed 不保证操作的顺序性，因此可能会出现同时读写冲突的情况。这可能导致某些递增操作被覆盖或丢失，从而进一步导致计数器值的不精确。
缓存不一致性：每个处理器核心都有自己的缓存，当多个核心同时对同一个计数器进行操作时，可能会由于缓存不一致性而导致某些操作未能及时更新到主存或其他核心的缓存中。这也会导致计数器值的不精确。
编译器优化：编译器可能会根据其对代码的理解进行优化，这可能导致原子操作看起来没有被正确执行。例如，编译器可能会将多次对同一变量的原子递增优化为一次递增，或者将原子操作与非原子操作重新排序，这都可能导致计数器值的不精确。

由于这些原因，使用 std::memory_order_relaxed 作为计数器的内存序时，最终计数器的值可能不是所有线程递增操作的总和，而是小于这个总和。如果你需要确保计数器的精确性，那么应该使用更严格的内存序，如 std::memory_order_acquire 和 std::memory_order_release 或者 std::memory_order_seq_cst，这些内存序提供了不同程度的同步保证，可以减少操作重新排序和缓存不一致性对计数器精确性的影响。

3 std::memory_order_acquire 与 std::memory_order_release

std::memory_order_acquire 通常用于那些需要读取共享数据的线程。它确保了在执行 acquire 操作之前的所有写操作（无论是在同一线程还是在其他线程中）都不会被重排序到 acquire 操作之后。这样，使用 std::memory_order_acquire 的线程可以确保看到其他线程对共享数据的最新写入。

std::memory_order_release 则常用于修改共享数据的线程。它确保了在执行 release 操作之后的所有写操作（无论是在同一线程还是在其他线程中）都不会被重排序到 release 操作之前。这有助于确保其他线程在读取共享数据时，能够看到该线程对共享数据的修改。

示例：

假设有两个线程，一个线程负责产生数据（生产者），另一个线程负责消费这些数据（消费者）。生产者线程在准备好数据后会设置一个标志，消费者线程则根据这个标志来读取数据。

#include <atomic>  
#include <thread>  
#include <iostream>  
  
std::atomic<bool> ready{false};  
std::atomic<int> data{0};  
  
void producer() {  
    data.store(12, std::memory_order_release); // 使用release内存序发布数据  
    ready.store(true, std::memory_order_release); // 发布标志，表示数据已准备好  
}  
  
void consumer() {  
    while (!ready.load(std::memory_order_acquire)) { // 使用acquire内存序等待数据  
        // 等待数据准备好  
    }  
    std::cout << "Consumed data: " << data.load(std::memory_order_relaxed) << std::endl; // 读取数据  
}  
  
int main() 
{  
    std::thread prod(producer);  
    std::thread cons(consumer);  
      
    prod.join();  
    cons.join();  
      
    return 0;  
}

上面代码的输出为：

Consumed data: 12

在这个示例中，生产者线程使用 std::memory_order_release 来发布数据和标志，确保消费者线程在读取这些数据时能够看到最新的值。消费者线程则使用 std::memory_order_acquire 来读取标志，并在标志为 true 时读取数据，确保不会读取到旧的数据或未初始化的数据。

需要注意的是，std::memory_order_acquire 和 std::memory_order_release 通常配对使用，以确保数据的正确发布和获取。此外，还需要注意其他线程同步机制，如互斥锁等，以确保多线程访问共享数据时不会引发数据竞争或其他并发问题。

4 std::memory_order_seq_cst

std::memory_order_seq_cst（Sequential Consistency，顺序一致性）是 C++11 1中一种最严格的内存序。它保证了所有线程看到的操作顺序都是全局一致的，即所有线程都按照相同的顺序来观察其他线程的操作。这种内存序在简化多线程编程的同时，可能会带来一定的性能开销。

应用场景：

std::memory_order_seq_cst 适用于需要确保所有读写操作都按照严格的顺序执行的场景。例如，在实现线程同步机制、确保数据的一致性，以及防止数据竞争等问题时，顺序一致性内存序可以提供可靠的保证。

示例：

假设有两个线程，线程 A 负责向一个共享变量写入数据，线程B则负责读取这个共享变量的数据。为了确保线程 B 能够正确地读取到线程 A 写入的数据，可以使用 std::memory_order_seq_cst 来保证操作的顺序一致性。

#include <atomic>  
#include <thread>  
#include <iostream>  
  
std::atomic<int> shared_data{0};  
  
void writer_thread() {  
    shared_data.store(12, std::memory_order_seq_cst); // 使用顺序一致性内存序写入数据  
}  
  
void reader_thread() {  
    int data = shared_data.load(std::memory_order_seq_cst); // 使用顺序一致性内存序读取数据  
    std::cout << "Read data: " << data << std::endl;  
}  
  
int main() 
{  
    std::thread writer(writer_thread);  
    std::thread reader(reader_thread);  
      
    writer.join();  
    reader.join();  
      
    return 0;  
}

上面代码的输出为：

Read data: 12

在这个示例中，线程 A 使用 std::memory_order_seq_cst 将值 12 写入 shared_data，线程 B 也使用 std::memory_order_seq_cst 来读取 shared_data 的值。由于使用了顺序一致性内存序，线程 B 将确保读取到线程 A 写入的最新值，而不会出现数据不一致的情况。

需要注意的是，尽管 std::memory_order_seq_cst 提供了严格的顺序一致性保证，但它也可能带来性能上的开销。因此，在不需要严格顺序一致性的场景中，可以考虑使用更宽松的内存序来优化性能。同时，在多线程编程中，还需要注意其他同步机制的使用，如互斥锁、条件变量等，以确保数据的安全访问和线程的正确同步。