【深入理解 C++11 多线程编程:从入门到实践】

一、 thread类的简单介绍

在C++11之前,涉及到多线程问题,都是和平台相关的,比如windows和linux下各有自己的接口,这使得代码的可移植性比较差。C++11中最重要的特性就是对线程进行支持了,使得C++在并行编程时不需要依赖第三方库,而且在原子操作中还引入了原子类的概念。要使用标准库中的 线程,必须包含< thread >头文件。C++11中线程类

函数名功能
thread()构造一个线程对象,没有关联任何线程函数,即没有启动任何线程
thread(fn, args1, args2, ...)构造一个线程对象,并关联线程函数fn,args1,args2,...为线程函数的参数
get_id()获取线程id
jionable()线程是否还在执行,joinable代表的是一个正在执行中的线程。
jion()该函数调用后会阻塞住主线程,当该线程结束后,主线程继续执行,在调用此函数后,线程对象将变为不可连接的,并且可以安全地销毁。
detach()在创建线程对象后马上调用,用于把被创建线程与线程对象分离开,分离的线程变为后台线程,创建的线程的"死活"就与主线程无关

注意:

1. 线程是操作系统中的一个概念,线程对象可以关联一个线程,用来控制线程以及获取线程的状态。

2. 当创建一个线程对象后,没有提供线程函数,该对象实际没有对应任何线程。

get_id()的返回值类型为id类型,id类型实际为std::thread命名空间下封装的一个类,该类中包含了一个结构体:

// vs下查看
typedef struct
{
    /* thread identifier for Win32 */
    void* _Hnd; /* Win32 HANDLE */
    unsigned int _Id;
} _Thrd_imp_t;

但是我们想要获得主线程的id就要使用单独的一个接口,在 C++ 中,获取主线程 ID 可以使用 std::this_thread::get_id() 接口。

3. 当创建一个线程对象后,并且给线程关联线程函数,该线程就被启动,与主线程一起运行。 线程函数一般情况下可按照以下三种方式提供: 函数指针、lambda表达式和函数对象

#include <iostream>
#include <thread>
using namespace std;

void ThreadFunc(int a)
{
	cout << "Thread1" << a << endl;
}
class TF
{
public:
	void operator()()
	{
		cout << "Thread3" << endl;
	}
};
int main()
{
    // 此时三个线程并发运行

	// 线程函数为函数指针
	thread t1(ThreadFunc, 10);
	// 线程函数为函数对象
	TF tf;
	thread t3(tf);
	// 线程函数为lambda表达式
	thread t2([] {cout << "Thread2" << endl; });

    // 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();
	t3.join();
	cout << "Main thread!" << endl;
	return 0;
}

我们来看一下运行结果:

4. thread类是防拷贝的,不允许拷贝构造以及赋值,但是可以移动构造和移动赋值,即将一个线程对象关联线程的状态转移给其他线程对象,转移期间不意向线程的执行。

5. 可以通过jionable()函数判断线程是否是有效的,如果是以下任意情况,则线程无效

  • 采用无参构造函数构造的线程对象
  • 线程对象的状态已经转移给其他线程对象
  • 线程已经调用jion或者detach结束

面试题:并发与并行的区别?

并发是指多个任务在同一时间段内被处理,但它们可能不是同时执行的。并发通常通过时间片轮转协作式多任务处理来实现,操作系统会将处理器时间分配给不同的任务,并快速地在它们之间切换。并行是指多个任务同时执行,在同一时间点上同时进行。并行需要多个处理器核心或多个处理单元来同时执行多个任务。并发是多个任务的交替执行,而并行是多个任务的同时执行

二、线程函数参数

线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的,因此:即使线程参数为引用类型,在 线程中修改后也不能修改外部实参,因为其实际引用的是线程栈中的拷贝,而不是外部实参。

#include <iostream>
#include <thread>
using namespace std;
void ThreadFunc1(int& x)
{
	x += 10;
}
void ThreadFunc2(int* x)
{
	*x += 10;
}
int main()
{
	int a = 10;
	// 在线程函数中对a修改,不会影响外部实参
	// 因为:线程函数参数虽然是引用方式,但其实际引用的是线程栈中的拷贝
	//thread t1(ThreadFunc1, a);
	//t1.join();
	//cout << a << endl;
	// 如果想要通过形参改变外部实参时,必须借助std::ref()函数
	thread t2(ThreadFunc1, std::ref(a));
	t2.join();
	cout << a << endl;
	// 或者我们还可以通过指针地址的拷贝
	thread t3(ThreadFunc2, &a);
	t3.join();
	cout << a << endl;
	return 0;
}

  • ThreadFunc1(int& x): 这个函数接受一个整型引用 x 作为参数。

    • thread t1(ThreadFunc1, a);: 创建了一个线程 t1,将 ThreadFunc1 函数指针作为线程函数,并传递了 a 作为参数。这里传递的 a 是变量 a 的副本,而不是引用本身。

    • t1.join();: 等待线程 t1 执行完毕。

    • cout << a << endl;: 输出 a 的值,仍然是 10,因为 ThreadFunc1 函数中的 x 只修改了其副本,没有影响到外部变量 a。

  • thread t2(ThreadFunc1, std::ref(a));: 这里使用了 std::ref(a),将 a 的引用传递给 ThreadFunc1 函数。这样,ThreadFunc1 函数中的 x 就直接指向了外部变量 a。因此,修改 x 会影响外部变量 a。

  • ThreadFunc2(int* x): 这个函数接受一个指向整型的指针 x 作为参数。

    • thread t3(ThreadFunc2, &a);: 创建了一个线程 t3,将 ThreadFunc2 函数指针作为线程函数,并传递了 a 的地址作为参数。这样,ThreadFunc2 函数中的 x 指向了外部变量 a。

总结:

  • 如果你直接将变量作为参数传递给线程函数,线程函数会修改一个副本,不会影响到外部变量。

  • 如果你希望线程函数修改外部变量,需要使用 std::ref() 或指针,将外部变量的引用或地址传递给线程函数。

注意:如果是类成员函数作为线程参数时,必须将this作为线程函数参数。

三、原子性操作库(atomic)

多线程最主要的问题是共享数据带来的问题(即线程安全)。如果共享数据都是只读的,那么没问 题,因为只读操作不会影响到数据,更不会涉及对数据的修改,所以所有线程都会获得同样的数 据。但是,当一个或多个线程要修改共享数据时,就会产生很多潜在的麻烦。比如:

int x = 0;
void Print(int n)
{
	for (size_t i = 0; i < n; i++)
	{
		x++;
	}
}
int main()
{
	// 此时两个线程并发运行
	thread t1(Print, 1000);
	thread t2(Print, 2000);
	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

我们来看一下运行结果:

这段代码的结果运行不对的原因在于 对 x 的增量操作 x++ 不是原子操作,在多线程环境下会导致 数据竞争,导致最终的输出结果不正确。

x++ 非原子操作: 在 C++ 中,x++ 操作是一个复合操作,它包含以下步骤:

  • 读取 x 的当前值。

  • 将 x 的值加 1。

  • 将新的值写回 x。

C++98中传统的解决方式:可以对共享修改的数据可以加锁保护。

int x = 0;
mutex mux; // 定义一把全局锁

void Print(int n)
{
	// 不能在这里定义锁
	// 因为栈内定义的锁每个线程都有一把,并不是唯一的
	mux.lock();
	// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
	for (size_t i = 0; i < n; i++)
	{
		x++;
	}
	mux.unlock();
}

int main()
{
	// 此时两个线程并发运行
	thread t1(Print, 10);
	thread t2(Print, 20);
	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

此时我们通过加锁,就能保证++操作不会被打断,从而能够保证结果的正确性。

但是我们上面加锁的地方是在for循环外面,也就意味着一个线程执行完了x++操作后,才会轮到下一个线程,因为每次只有一个线程可以获取锁,然后执行完整个 for 循环才会释放锁。其实这相当于串行运行了,但是我们之前学习到要让锁的粒度尽可以细,什么意思呢?将锁的范围尽可能缩小到真正需要保护的代码段。 这样可以减少锁的竞争,提高并发性能,所以我们可以将加锁与解锁操作加入到for循环之内。

int x = 0;
mutex mux; // 定义一把全局锁

void Print(int n)
{
	// 不能在这里定义锁
	// 因为栈内定义的锁每个线程都有一把,并不是唯一的
	// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
	for (size_t i = 0; i < n; i++)
	{
		mux.lock();
		x++;
		mux.unlock();
	}
}

int main()
{
	// 此时两个线程并发运行
	thread t1(Print, 10);
	thread t2(Print, 20);
	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

此时我们来看结果,发现依然是正确的

锁的粒度细化的好处:

  • 减少锁竞争: 多个线程竞争同一个锁的可能性降低,因为锁的范围更小。

  • 提高并发性能: 多个线程可以更频繁地获得锁,提高程序的整体执行效率。

注意事项:

  • 锁的粒度过细可能会导致性能下降: 如果锁的粒度太细,频繁地加锁和解锁会增加系统开销,反而会降低程序性能。

  • 选择合适的锁粒度需要根据具体情况进行权衡: 需要根据程序的逻辑、数据访问模式等因素来确定合适的锁粒度。

如果我们这里不想使用全局变量x和全局锁,我们也可以设置成局部的,然后通过线程的参数传递过去。

void Print(int n, int& x, mutex& mtx)
{
	// 不能在这里定义锁
	// 因为栈内定义的锁每个线程都有一把,并不是唯一的
	// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
	mtx.lock();
	for (size_t i = 0; i < n; i++)
	{
		x++;
	}
	mtx.unlock();
}

int main()
{
	int x = 0;
	mutex mtx;

	// 此时两个线程并发运行
	thread t1(Print, 10, x, mtx);
	thread t2(Print, 20, x, mtx);

	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

但是此时我们编译错误了,为什么呢?线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的,使用 std::ref() 或指针,将外部变量的引用或地址传递给线程函数。

void Print(int n, int& x, mutex& mtx)
{
	// 不能在这里定义锁
	// 因为栈内定义的锁每个线程都有一把,并不是唯一的
	// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
	mtx.lock();
	for (size_t i = 0; i < n; i++)
	{
		x++;
	}
	mtx.unlock();
}

int main()
{
	int x = 0;
	mutex mtx;

	// 此时两个线程并发运行
	thread t1(Print, 10, ref(x), ref(mtx));
	thread t2(Print, 20, ref(x), ref(mtx));

	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

但是这里也比较麻烦,我们可以发现thread的构造函数可以传入可调用对象,所以我们就可以写一个lambda表达式,在捕捉列表中对变量 x 和 锁 mtx 进行引用捕捉。通过引用捕获,可以轻松地共享 x 和 mtx 变量,避免了传递参数的麻烦。

int main()
{
	int x = 0;
	mutex mtx;

	auto Func = [&x, &mtx](int n)
		{
			mtx.lock();
			for (size_t i = 0; i < n; i++)
			{
				x++;
			}
			mtx.unlock();
		};

	// 此时两个线程并发运行
	thread t1(Func, 10);
	thread t2(Func, 20);

	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// 此时值出现的结果就可能出错
	// ++操作不保证原子性
	cout << x << endl;

	return 0;
}

虽然加锁可以解决,但是加锁有一个缺陷就是:只要一个线程在对x++时,其他线程就会被阻塞,会影响程序运行的效率,而且锁如果控制不好,还容易造成死锁。因此C++11中引入了原子操作。所谓原子操作:即不可被中断的一个或一系列操作,C++11引入 的原子操作类型,使得线程间数据的同步变得非常高效。

注意:需要使用以上原子操作变量时,必须添加头文件

# include <atomic>
int main()
{
	atomic<int> x = 0; // cas 原子操作
	atomic<int> x{ 0 }; // cas 原子操作
	auto Func = [&](int n)
		{
			for (size_t i = 0; i < n; i++)
			{
				++x;
			}
		};

	// 此时两个线程并发运行
	thread t1(Func, 10);
	thread t2(Func, 20);
	// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
	t1.join();
	t2.join();

	// ++操作保证原子性
	cout << x << endl;

	return 0;
}

在C++11中,程序员不需要对原子类型变量进行加锁解锁操作,线程能够对原子类型变量互斥的 访问。 更为普遍的,程序员可以使用atomic类模板,定义出需要的任意原子类型。

atmoic<T> t;   // 声明一个类型为T的原子类型变量t

注意:原子类型通常属于"资源型"数据,多个线程只能访问单个原子类型的拷贝,因此在C++11 中,原子类型只能从其模板参数中进行构造,不允许原子类型进行拷贝构造、移动构造以及 operator=等,为了防止意外,标准库已经将atmoic模板类中的拷贝构造、移动构造、赋值运算符重载默认删除掉了。

#include <atomic>
int main()
{
	atomic<int> a1(0);
	//atomic<int> a2(a1);    // 编译失败
	atomic<int> a2(0);
	//a2 = a1;               // 编译失败
	return 0;
}

四、lock_guard与unique_lock

在多线程环境下,如果想要保证某个变量的安全性,只要将其设置成对应的原子类型即可,即高 效又不容易出现死锁问题。但是有些情况下,我们可能需要保证一段代码的安全性,那么就只能 通过锁的方式来进行控制。

比如:一个线程对变量number进行加一100次,另外一个减一100次,每次操作加一或者减一之 后,输出number的结果,要求:number最后的值为1。

#include <thread>
#include <mutex>

int number = 1;
mutex g_lock;

int ThreadProc1()
{
	for (int i = 0; i < 100; i++)
	{
		g_lock.lock();
		++number;
		cout << "thread 1 :" << number << endl;
		g_lock.unlock();
	}
	return 0;
}

int ThreadProc2()
{
	for (int i = 0; i < 100; i++)
	{
		g_lock.lock(); --number;
		cout << "thread 2 :" << number << endl;
		g_lock.unlock();
	}
	return 0;
}
int main()
{
	thread t1(ThreadProc1);
	thread t2(ThreadProc2);
	t1.join();
	t2.join();
	cout << "number:" << number << endl;
	system("pause");
	return 0;
}

上述代码的缺陷:锁控制不好时,可能会造成死锁,最常见的比如在锁中间代码返回,或者在锁 的范围内抛异常。因此:C++11采用RAII的方式对锁进行了封装,即lock_guard和unique_lock。

4.1. mutex的种类

在C++11中,Mutex总共包了四个互斥量的种类:

1). std::mutex

C++11提供的最基本的互斥量,该类的对象之间不能拷贝,也不能进行移动。mutex最常用 的三个函数:

函数名

函数功能
lock()上锁:锁住互斥量
unlock()解锁:释放对互斥量的所有权
try_lock()尝试锁住互斥量,如果互斥量被其他线程占有,则当前线程也不会被阻塞

注意,线程函数调用lock()时,可能会发生以下三种情况:

  • 如果该互斥量当前没有被锁住,则调用线程将该互斥量锁住,直到调用 unlock之前, 该线程一直拥有该锁
  • 如果当前互斥量被其他线程锁住,则当前的调用线程被阻塞住
  • 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)

线程函数调用try_lock()时,可能会发生以下三种情况:

  • 如果当前互斥量没有被其他线程占有,则该线程锁住互斥量,直到该线程调用 unlock 释放互斥量
  • 如果当前互斥量被其他线程锁住,则当前调用线程返回 false,而并不会被阻塞掉
  • 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)  

2). std::recursive_mutex

其允许同一个线程对互斥量多次上锁(即递归上锁),来获得对互斥量对象的多层所有权, 释放互斥量时需要调用与该锁层次深度相同次数的 unlock(),除此之外, std::recursive_mutex 的特性和 std::mutex 大致相同。

3). std::timed_mutex

比 std::mutex 多了两个成员函数,try_lock_for(),try_lock_until() 。

  • try_lock_for()

接受一个时间范围,表示在这一段时间范围之内线程如果没有获得锁则被阻塞住(与 std::mutex 的 try_lock() 不同,try_lock 如果被调用时没有获得锁则直接返回 false),如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超 时(即在指定时间内还是没有获得锁),则返回 false。

  • try_lock_until()

接受一个时间点作为参数,在指定时间点未到来之前线程如果没有获得锁则被阻塞住, 如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指 定时间内还是没有获得锁),则返回 false。

4). std::recursive_timed_mutex

4.2. lock_guard

std::lock_gurad 是 C++11 中定义的模板类。定义如下:

// 支持各种锁
template<class Lock>
class LockGuard
{
public:
	LockGuard(Lock& lock)
		:_lock(lock)
	{
		_lock.lock();
	}

	LockGuard(const LockGuard&) = delete;
	LockGuard& operator= (const LockGuard&) = delete;

	~LockGuard()
	{
		_lock.unlock();
	}
private:
	Lock& _lock; //引用的成员变量必须在初始化列表进行初始化
};

通过上述代码可以看到,LockGuard类模板主要是通过RAII的方式,对其管理的互斥量进行了封 装,在需要加锁的地方,只需要用上述介绍的任意互斥体实例化一个LockGuard,调用构造函数 成功上锁,出作用域前,LockGuard对象要被销毁,调用析构函数自动解锁,可以有效避免死锁 问题。

lock_guard的缺陷:太单一,用户没有办法对该锁进行控制,因此C++11又提供了 unique_lock。

4.3. unique_lock

与lock_gard类似,unique_lock类模板也是采用RAII的方式对锁进行了封装,并且也是以独占所 有权的方式管理mutex对象的上锁和解锁操作,即其对象之间不能发生拷贝。在构造(或移动 (move)赋值)时,unique_lock 对象需要传递一个 Mutex 对象作为它的参数,新创建的 unique_lock 对象负责传入的 Mutex 对象的上锁和解锁操作。使用以上类型互斥量实例化 unique_lock的对象时,自动调用构造函数上锁,unique_lock对象销毁时自动调用析构函数解锁,可以很方便的防止死锁问题。

与lock_guard不同的是,unique_lock更加的灵活,提供了更多的成员函数:

  • 上锁/解锁操作:lock、try_lock、try_lock_for、try_lock_until和unlock
  • 修改操作:移动赋值、交换(swap:与另一个unique_lock对象互换所管理的互斥量所有权)、释放(release:返回它所管理的互斥量对象的指针,并释放所有权)
  • 获取属性:owns_lock(返回当前对象是否上了锁)、operator bool()(与owns_lock()的功能相 同)、mutex(返回当前unique_lock所管理的互斥量的指针)。

lock_guard和unique_lock

五、支持两个线程交替打印,一个打印奇数,一个打印偶数

本节主要演示了condition_variable的使用,condition_variable熟悉我们linux课程已经讲过了,他们用来进行线程之间的互相通知。condition_variable和Linux posix的条件变量并没有什么大的区别,主要还是面向对象实现的。条件变量的文档如下:cplusplus.com/reference/condition_variable/

#include <thread>
#include <mutex>
#include <condition_variable>
using namespace std;

void two_thread_print()
{
	mutex mtx; // 锁
	int n = 100;
	bool flag = true;
	condition_variable c; // 条件变量

	// 输出偶数
	thread t1([&]() {
		int i = 0;
		while (i < n)
		{
			unique_lock<mutex> lock(mtx);
			while (!flag)
				c.wait(lock); // 先被阻塞,wait使用会释放锁
		
			cout << "Thread 1: " <<  i << endl;
			flag = false;
			i += 2; // 偶数

			c.notify_one(); // 会自动申请锁
			
		}
		});
	// 输出奇数
	thread t2([&]() {
		int j = 1;
		while (j < n)
		{
			unique_lock<mutex> lock(mtx);
			while(flag)
				c.wait(lock); // 先被阻塞,wait使用会释放锁

			cout << "Thread 2: " << j << endl;
			j += 2; // 奇数
			flag = true;

			c.notify_one(); // 会自动申请锁
		}
		});
	t1.join();
	t2.join();
}
int main()
{
	two_thread_print();
	return 0;
}

我们来看一下结果:

本章结束啦!!!

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值