【深入理解 C++11 多线程编程：从入门到实践】

本文链接：https://blog.csdn.net/qq_64446981/article/details/140614199

一、 thread类的简单介绍

在C++11之前，涉及到多线程问题，都是和平台相关的，比如windows和linux下各有自己的接口，这使得代码的可移植性比较差。C++11中最重要的特性就是对线程进行支持了，使得C++在并行编程时不需要依赖第三方库，而且在原子操作中还引入了原子类的概念。要使用标准库中的线程，必须包含< thread >头文件。C++11中线程类

函数名	功能
thread()	构造一个线程对象，没有关联任何线程函数，即没有启动任何线程
thread(fn, args1, args2, ...)	构造一个线程对象，并关联线程函数fn，args1，args2，...为线程函数的参数
get_id()	获取线程id
jionable()	线程是否还在执行，joinable代表的是一个正在执行中的线程。
jion()	该函数调用后会阻塞住主线程，当该线程结束后，主线程继续执行，在调用此函数后，线程对象将变为不可连接的，并且可以安全地销毁。
detach()	在创建线程对象后马上调用，用于把被创建线程与线程对象分离开，分离的线程变为后台线程，创建的线程的"死活"就与主线程无关

注意：

1. 线程是操作系统中的一个概念，线程对象可以关联一个线程，用来控制线程以及获取线程的状态。

2. 当创建一个线程对象后，没有提供线程函数，该对象实际没有对应任何线程。

get_id()的返回值类型为id类型，id类型实际为std::thread命名空间下封装的一个类，该类中包含了一个结构体：

// vs下查看
typedef struct
{
    /* thread identifier for Win32 */
    void* _Hnd; /* Win32 HANDLE */
    unsigned int _Id;
} _Thrd_imp_t;

但是我们想要获得主线程的id就要使用单独的一个接口，在 C++ 中，获取主线程 ID 可以使用 std::this_thread::get_id() 接口。

3. 当创建一个线程对象后，并且给线程关联线程函数，该线程就被启动，与主线程一起运行。线程函数一般情况下可按照以下三种方式提供：函数指针、lambda表达式和函数对象

#include <iostream>
#include <thread>
using namespace std;

void ThreadFunc(int a)
{
	cout << "Thread1" << a << endl;
}
class TF
{
public:
	void operator()()
	{
		cout << "Thread3" << endl;
	}
};
int main()
{
    // 此时三个线程并发运行

	// 线程函数为函数指针
	thread t1(ThreadFunc, 10);
	// 线程函数为函数对象
	TF tf;
	thread t3(tf);
	// 线程函数为lambda表达式
	thread t2([] {cout << "Thread2" << endl; });

    // 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();
	t3.join();
	cout << "Main thread!" << endl;
	return 0;
}

我们来看一下运行结果：

4. thread类是防拷贝的，不允许拷贝构造以及赋值，但是可以移动构造和移动赋值，即将一个线程对象关联线程的状态转移给其他线程对象，转移期间不意向线程的执行。

5. 可以通过jionable()函数判断线程是否是有效的，如果是以下任意情况，则线程无效

采用无参构造函数构造的线程对象
线程对象的状态已经转移给其他线程对象
线程已经调用jion或者detach结束

面试题：并发与并行的区别？

并发是指多个任务在同一时间段内被处理，但它们可能不是同时执行的。并发通常通过时间片轮转或协作式多任务处理来实现，操作系统会将处理器时间分配给不同的任务，并快速地在它们之间切换。并行是指多个任务同时执行，在同一时间点上同时进行。并行需要多个处理器核心或多个处理单元来同时执行多个任务。并发是多个任务的交替执行，而并行是多个任务的同时执行。

二、线程函数参数

线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的，因此：即使线程参数为引用类型，在线程中修改后也不能修改外部实参，因为其实际引用的是线程栈中的拷贝，而不是外部实参。

#include <iostream>
#include <thread>
using namespace std;
void ThreadFunc1(int& x)
{
	x += 10;
}
void ThreadFunc2(int* x)
{
	*x += 10;
}
int main()
{
	int a = 10;
	// 在线程函数中对a修改，不会影响外部实参
	// 因为：线程函数参数虽然是引用方式，但其实际引用的是线程栈中的拷贝
	//thread t1(ThreadFunc1, a);
	//t1.join();
	//cout << a << endl;
	// 如果想要通过形参改变外部实参时，必须借助std::ref()函数
	thread t2(ThreadFunc1, std::ref(a));
	t2.join();
	cout << a << endl;
	// 或者我们还可以通过指针地址的拷贝
	thread t3(ThreadFunc2, &a);
	t3.join();
	cout << a << endl;
	return 0;
}

ThreadFunc1(int& x): 这个函数接受一个整型引用 x 作为参数。

thread t1(ThreadFunc1, a);: 创建了一个线程 t1，将 ThreadFunc1 函数指针作为线程函数，并传递了 a 作为参数。这里传递的 a 是变量 a 的副本，而不是引用本身。

t1.join();: 等待线程 t1 执行完毕。

cout << a << endl;: 输出 a 的值，仍然是 10，因为 ThreadFunc1 函数中的 x 只修改了其副本，没有影响到外部变量 a。

thread t2(ThreadFunc1, std::ref(a));: 这里使用了 std::ref(a)，将 a 的引用传递给 ThreadFunc1 函数。这样，ThreadFunc1 函数中的 x 就直接指向了外部变量 a。因此，修改 x 会影响外部变量 a。

ThreadFunc2(int* x): 这个函数接受一个指向整型的指针 x 作为参数。

thread t3(ThreadFunc2, &a);: 创建了一个线程 t3，将 ThreadFunc2 函数指针作为线程函数，并传递了 a 的地址作为参数。这样，ThreadFunc2 函数中的 x 指向了外部变量 a。

总结:

如果你直接将变量作为参数传递给线程函数，线程函数会修改一个副本，不会影响到外部变量。
如果你希望线程函数修改外部变量，需要使用 std::ref() 或指针，将外部变量的引用或地址传递给线程函数。

注意：如果是类成员函数作为线程参数时，必须将this作为线程函数参数。

三、原子性操作库(atomic)

多线程最主要的问题是共享数据带来的问题(即线程安全)。如果共享数据都是只读的，那么没问题，因为只读操作不会影响到数据，更不会涉及对数据的修改，所以所有线程都会获得同样的数据。但是，当一个或多个线程要修改共享数据时，就会产生很多潜在的麻烦。比如：

int x = 0;
void Print(int n)
{
	for (size_t i = 0; i < n; i++)
	{
		x++;
	}
}
int main()
{
	// 此时两个线程并发运行
	thread t1(Print, 1000);
	thread t2(Print, 2000);
	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

我们来看一下运行结果：

这段代码的结果运行不对的原因在于 对 x 的增量操作 x++ 不是原子操作，在多线程环境下会导致 数据竞争，导致最终的输出结果不正确。

x++ 非原子操作: 在 C++ 中，x++ 操作是一个复合操作，它包含以下步骤：

读取 x 的当前值。

将 x 的值加 1。

将新的值写回 x。

C++98中传统的解决方式：可以对共享修改的数据可以加锁保护。

int x = 0;
mutex mux; // 定义一把全局锁

void Print(int n)
{
	// 不能在这里定义锁
	// 因为栈内定义的锁每个线程都有一把,并不是唯一的
	mux.lock();
	// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
	for (size_t i = 0; i < n; i++)
	{
		x++;
	}
	mux.unlock();
}

int main()
{
	// 此时两个线程并发运行
	thread t1(Print, 10);
	thread t2(Print, 20);
	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

此时我们通过加锁，就能保证++操作不会被打断，从而能够保证结果的正确性。

但是我们上面加锁的地方是在for循环外面，也就意味着一个线程执行完了x++操作后，才会轮到下一个线程，因为每次只有一个线程可以获取锁，然后执行完整个 for 循环才会释放锁。其实这相当于串行运行了，但是我们之前学习到要让锁的粒度尽可以细，什么意思呢？将锁的范围尽可能缩小到真正需要保护的代码段。 这样可以减少锁的竞争，提高并发性能，所以我们可以将加锁与解锁操作加入到for循环之内。

int x = 0;
mutex mux; // 定义一把全局锁

void Print(int n)
{
	// 不能在这里定义锁
	// 因为栈内定义的锁每个线程都有一把,并不是唯一的
	// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
	for (size_t i = 0; i < n; i++)
	{
		mux.lock();
		x++;
		mux.unlock();
	}
}

int main()
{
	// 此时两个线程并发运行
	thread t1(Print, 10);
	thread t2(Print, 20);
	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

此时我们来看结果，发现依然是正确的

锁的粒度细化的好处:

减少锁竞争: 多个线程竞争同一个锁的可能性降低，因为锁的范围更小。

提高并发性能: 多个线程可以更频繁地获得锁，提高程序的整体执行效率。

注意事项:

锁的粒度过细可能会导致性能下降： 如果锁的粒度太细，频繁地加锁和解锁会增加系统开销，反而会降低程序性能。

选择合适的锁粒度需要根据具体情况进行权衡: 需要根据程序的逻辑、数据访问模式等因素来确定合适的锁粒度。

如果我们这里不想使用全局变量x和全局锁，我们也可以设置成局部的，然后通过线程的参数传递过去。

void Print(int n, int& x, mutex& mtx)
{
	// 不能在这里定义锁
	// 因为栈内定义的锁每个线程都有一把,并不是唯一的
	// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
	mtx.lock();
	for (size_t i = 0; i < n; i++)
	{
		x++;
	}
	mtx.unlock();
}

int main()
{
	int x = 0;
	mutex mtx;

	// 此时两个线程并发运行
	thread t1(Print, 10, x, mtx);
	thread t2(Print, 20, x, mtx);

	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

但是此时我们编译错误了，为什么呢？线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的，使用 std::ref() 或指针，将外部变量的引用或地址传递给线程函数。

void Print(int n, int& x, mutex& mtx)
{
	// 不能在这里定义锁
	// 因为栈内定义的锁每个线程都有一把,并不是唯一的
	// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
	mtx.lock();
	for (size_t i = 0; i < n; i++)
	{
		x++;
	}
	mtx.unlock();
}

int main()
{
	int x = 0;
	mutex mtx;

	// 此时两个线程并发运行
	thread t1(Print, 10, ref(x), ref(mtx));
	thread t2(Print, 20, ref(x), ref(mtx));

	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

但是这里也比较麻烦，我们可以发现thread的构造函数可以传入可调用对象，所以我们就可以写一个lambda表达式，在捕捉列表中对变量 x 和锁 mtx 进行引用捕捉。通过引用捕获，可以轻松地共享 x 和 mtx 变量，避免了传递参数的麻烦。

int main()
{
	int x = 0;
	mutex mtx;

	auto Func = [&x, &mtx](int n)
		{
			mtx.lock();
			for (size_t i = 0; i < n; i++)
			{
				x++;
			}
			mtx.unlock();
		};

	// 此时两个线程并发运行
	thread t1(Func, 10);
	thread t2(Func, 20);

	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

虽然加锁可以解决，但是加锁有一个缺陷就是：只要一个线程在对x++时，其他线程就会被阻塞，会影响程序运行的效率，而且锁如果控制不好，还容易造成死锁。因此C++11中引入了原子操作。所谓原子操作：即不可被中断的一个或一系列操作，C++11引入的原子操作类型，使得线程间数据的同步变得非常高效。

注意：需要使用以上原子操作变量时，必须添加头文件

# include <atomic>
int main()
{
	atomic<int> x = 0; // cas 原子操作
	atomic<int> x{ 0 }; // cas 原子操作
	auto Func = [&](int n)
		{
			for (size_t i = 0; i < n; i++)
			{
				++x;
			}
		};

	// 此时两个线程并发运行
	thread t1(Func, 10);
	thread t2(Func, 20);
	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// ++操作保证原子性
	cout << x << endl;

	return 0;
}

在C++11中，程序员不需要对原子类型变量进行加锁解锁操作，线程能够对原子类型变量互斥的访问。更为普遍的，程序员可以使用atomic类模板，定义出需要的任意原子类型。

atmoic<T> t;   // 声明一个类型为T的原子类型变量t

注意：原子类型通常属于"资源型"数据，多个线程只能访问单个原子类型的拷贝，因此在C++11 中，原子类型只能从其模板参数中进行构造，不允许原子类型进行拷贝构造、移动构造以及 operator=等，为了防止意外，标准库已经将atmoic模板类中的拷贝构造、移动构造、赋值运算符重载默认删除掉了。

#include <atomic>
int main()
{
	atomic<int> a1(0);
	//atomic<int> a2(a1);    // 编译失败
	atomic<int> a2(0);
	//a2 = a1;               // 编译失败
	return 0;
}

四、lock_guard与unique_lock

在多线程环境下，如果想要保证某个变量的安全性，只要将其设置成对应的原子类型即可，即高效又不容易出现死锁问题。但是有些情况下，我们可能需要保证一段代码的安全性，那么就只能通过锁的方式来进行控制。

比如：一个线程对变量number进行加一100次，另外一个减一100次，每次操作加一或者减一之后，输出number的结果，要求：number最后的值为1。

#include <thread>
#include <mutex>

int number = 1;
mutex g_lock;

int ThreadProc1()
{
	for (int i = 0; i < 100; i++)
	{
		g_lock.lock();
		++number;
		cout << "thread 1 :" << number << endl;
		g_lock.unlock();
	}
	return 0;
}

int ThreadProc2()
{
	for (int i = 0; i < 100; i++)
	{
		g_lock.lock(); --number;
		cout << "thread 2 :" << number << endl;
		g_lock.unlock();
	}
	return 0;
}
int main()
{
	thread t1(ThreadProc1);
	thread t2(ThreadProc2);
	t1.join();
	t2.join();
	cout << "number:" << number << endl;
	system("pause");
	return 0;
}

上述代码的缺陷：锁控制不好时，可能会造成死锁，最常见的比如在锁中间代码返回，或者在锁的范围内抛异常。因此：C++11采用RAII的方式对锁进行了封装，即lock_guard和unique_lock。

4.1. mutex的种类

在C++11中，Mutex总共包了四个互斥量的种类：

1). std::mutex

C++11提供的最基本的互斥量，该类的对象之间不能拷贝，也不能进行移动。mutex最常用的三个函数：

函数名	函数功能
lock()	上锁：锁住互斥量
unlock()	解锁：释放对互斥量的所有权
try_lock()	尝试锁住互斥量，如果互斥量被其他线程占有，则当前线程也不会被阻塞

注意，线程函数调用lock()时，可能会发生以下三种情况：

如果该互斥量当前没有被锁住，则调用线程将该互斥量锁住，直到调用 unlock之前，该线程一直拥有该锁
如果当前互斥量被其他线程锁住，则当前的调用线程被阻塞住
如果当前互斥量被当前调用线程锁住，则会产生死锁(deadlock)

线程函数调用try_lock()时，可能会发生以下三种情况：

如果当前互斥量没有被其他线程占有，则该线程锁住互斥量，直到该线程调用 unlock 释放互斥量
如果当前互斥量被其他线程锁住，则当前调用线程返回 false，而并不会被阻塞掉
如果当前互斥量被当前调用线程锁住，则会产生死锁(deadlock)

2). std::recursive_mutex

其允许同一个线程对互斥量多次上锁（即递归上锁），来获得对互斥量对象的多层所有权，释放互斥量时需要调用与该锁层次深度相同次数的 unlock()，除此之外， std::recursive_mutex 的特性和 std::mutex 大致相同。

3). std::timed_mutex

比 std::mutex 多了两个成员函数，try_lock_for()，try_lock_until() 。

try_lock_for()

接受一个时间范围，表示在这一段时间范围之内线程如果没有获得锁则被阻塞住（与 std::mutex 的 try_lock() 不同，try_lock 如果被调用时没有获得锁则直接返回 false），如果在此期间其他线程释放了锁，则该线程可以获得对互斥量的锁，如果超时（即在指定时间内还是没有获得锁），则返回 false。

try_lock_until()

接受一个时间点作为参数，在指定时间点未到来之前线程如果没有获得锁则被阻塞住，如果在此期间其他线程释放了锁，则该线程可以获得对互斥量的锁，如果超时（即在指定时间内还是没有获得锁），则返回 false。

4). std::recursive_timed_mutex

4.2. lock_guard

std::lock_gurad 是 C++11 中定义的模板类。定义如下：

// 支持各种锁
template<class Lock>
class LockGuard
{
public:
	LockGuard(Lock& lock)
		:_lock(lock)
	{
		_lock.lock();
	}

	LockGuard(const LockGuard&) = delete;
	LockGuard& operator= (const LockGuard&) = delete;

	~LockGuard()
	{
		_lock.unlock();
	}
private:
	Lock& _lock; //引用的成员变量必须在初始化列表进行初始化
};

通过上述代码可以看到，LockGuard类模板主要是通过RAII的方式，对其管理的互斥量进行了封装，在需要加锁的地方，只需要用上述介绍的任意互斥体实例化一个LockGuard，调用构造函数成功上锁，出作用域前，LockGuard对象要被销毁，调用析构函数自动解锁，可以有效避免死锁问题。

lock_guard的缺陷：太单一，用户没有办法对该锁进行控制，因此C++11又提供了 unique_lock。

4.3. unique_lock

与lock_gard类似，unique_lock类模板也是采用RAII的方式对锁进行了封装，并且也是以独占所有权的方式管理mutex对象的上锁和解锁操作，即其对象之间不能发生拷贝。在构造(或移动 (move)赋值)时，unique_lock 对象需要传递一个 Mutex 对象作为它的参数，新创建的 unique_lock 对象负责传入的 Mutex 对象的上锁和解锁操作。使用以上类型互斥量实例化 unique_lock的对象时，自动调用构造函数上锁，unique_lock对象销毁时自动调用析构函数解锁，可以很方便的防止死锁问题。

与lock_guard不同的是，unique_lock更加的灵活，提供了更多的成员函数：

上锁/解锁操作：lock、try_lock、try_lock_for、try_lock_until和unlock
修改操作：移动赋值、交换(swap：与另一个unique_lock对象互换所管理的互斥量所有权)、释放(release：返回它所管理的互斥量对象的指针，并释放所有权)
获取属性：owns_lock(返回当前对象是否上了锁)、operator bool()(与owns_lock()的功能相同)、mutex(返回当前unique_lock所管理的互斥量的指针)。

lock_guard和unique_lock

五、支持两个线程交替打印，一个打印奇数，一个打印偶数

本节主要演示了condition_variable的使用，condition_variable熟悉我们linux课程已经讲过了，他们用来进行线程之间的互相通知。condition_variable和Linux posix的条件变量并没有什么大的区别，主要还是面向对象实现的。条件变量的文档如下:cplusplus.com/reference/condition_variable/

#include <thread>
#include <mutex>
#include <condition_variable>
using namespace std;

void two_thread_print()
{
	mutex mtx; // 锁
	int n = 100;
	bool flag = true;
	condition_variable c; // 条件变量

	// 输出偶数
	thread t1([&]() {
		int i = 0;
		while (i < n)
		{
			unique_lock<mutex> lock(mtx);
			while (!flag)
				c.wait(lock); // 先被阻塞,wait使用会释放锁
		
			cout << "Thread 1: " <<  i << endl;
			flag = false;
			i += 2; // 偶数

			c.notify_one(); // 会自动申请锁
			
		}
		});
	// 输出奇数
	thread t2([&]() {
		int j = 1;
		while (j < n)
		{
			unique_lock<mutex> lock(mtx);
			while(flag)
				c.wait(lock); // 先被阻塞,wait使用会释放锁

			cout << "Thread 2: " << j << endl;
			j += 2; // 奇数
			flag = true;

			c.notify_one(); // 会自动申请锁
		}
		});
	t1.join();
	t2.join();
}
int main()
{
	two_thread_print();
	return 0;
}

我们来看一下结果：