一、 thread类的简单介绍
在C++11之前,涉及到多线程问题,都是和平台相关的,比如windows和linux下各有自己的接口,这使得代码的可移植性比较差。C++11中最重要的特性就是对线程进行支持了,使得C++在并行编程时不需要依赖第三方库,而且在原子操作中还引入了原子类的概念。要使用标准库中的 线程,必须包含< thread >头文件。C++11中线程类
函数名 | 功能 |
thread() | 构造一个线程对象,没有关联任何线程函数,即没有启动任何线程 |
thread(fn, args1, args2, ...) | 构造一个线程对象,并关联线程函数fn,args1,args2,...为线程函数的参数 |
get_id() | 获取线程id |
jionable() | 线程是否还在执行,joinable代表的是一个正在执行中的线程。 |
jion() | 该函数调用后会阻塞住主线程,当该线程结束后,主线程继续执行,在调用此函数后,线程对象将变为不可连接的,并且可以安全地销毁。 |
detach() | 在创建线程对象后马上调用,用于把被创建线程与线程对象分离开,分离的线程变为后台线程,创建的线程的"死活"就与主线程无关 |
注意:
1. 线程是操作系统中的一个概念,线程对象可以关联一个线程,用来控制线程以及获取线程的状态。
2. 当创建一个线程对象后,没有提供线程函数,该对象实际没有对应任何线程。
get_id()的返回值类型为id类型,id类型实际为std::thread命名空间下封装的一个类,该类中包含了一个结构体:
// vs下查看
typedef struct
{
/* thread identifier for Win32 */
void* _Hnd; /* Win32 HANDLE */
unsigned int _Id;
} _Thrd_imp_t;
但是我们想要获得主线程的id就要使用单独的一个接口,在 C++ 中,获取主线程 ID 可以使用 std::this_thread::get_id() 接口。
3. 当创建一个线程对象后,并且给线程关联线程函数,该线程就被启动,与主线程一起运行。 线程函数一般情况下可按照以下三种方式提供: 函数指针、lambda表达式和函数对象
#include <iostream>
#include <thread>
using namespace std;
void ThreadFunc(int a)
{
cout << "Thread1" << a << endl;
}
class TF
{
public:
void operator()()
{
cout << "Thread3" << endl;
}
};
int main()
{
// 此时三个线程并发运行
// 线程函数为函数指针
thread t1(ThreadFunc, 10);
// 线程函数为函数对象
TF tf;
thread t3(tf);
// 线程函数为lambda表达式
thread t2([] {cout << "Thread2" << endl; });
// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
t1.join();
t2.join();
t3.join();
cout << "Main thread!" << endl;
return 0;
}
我们来看一下运行结果:
4. thread类是防拷贝的,不允许拷贝构造以及赋值,但是可以移动构造和移动赋值,即将一个线程对象关联线程的状态转移给其他线程对象,转移期间不意向线程的执行。
5. 可以通过jionable()函数判断线程是否是有效的,如果是以下任意情况,则线程无效
- 采用无参构造函数构造的线程对象
- 线程对象的状态已经转移给其他线程对象
- 线程已经调用jion或者detach结束
面试题:并发与并行的区别?
并发是指多个任务在同一时间段内被处理,但它们可能不是同时执行的。并发通常通过时间片轮转或协作式多任务处理来实现,操作系统会将处理器时间分配给不同的任务,并快速地在它们之间切换。并行是指多个任务同时执行,在同一时间点上同时进行。并行需要多个处理器核心或多个处理单元来同时执行多个任务。并发是多个任务的交替执行,而并行是多个任务的同时执行。
二、线程函数参数
线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的,因此:即使线程参数为引用类型,在 线程中修改后也不能修改外部实参,因为其实际引用的是线程栈中的拷贝,而不是外部实参。
#include <iostream>
#include <thread>
using namespace std;
void ThreadFunc1(int& x)
{
x += 10;
}
void ThreadFunc2(int* x)
{
*x += 10;
}
int main()
{
int a = 10;
// 在线程函数中对a修改,不会影响外部实参
// 因为:线程函数参数虽然是引用方式,但其实际引用的是线程栈中的拷贝
//thread t1(ThreadFunc1, a);
//t1.join();
//cout << a << endl;
// 如果想要通过形参改变外部实参时,必须借助std::ref()函数
thread t2(ThreadFunc1, std::ref(a));
t2.join();
cout << a << endl;
// 或者我们还可以通过指针地址的拷贝
thread t3(ThreadFunc2, &a);
t3.join();
cout << a << endl;
return 0;
}
ThreadFunc1(int& x): 这个函数接受一个整型引用 x 作为参数。
thread t1(ThreadFunc1, a);: 创建了一个线程 t1,将 ThreadFunc1 函数指针作为线程函数,并传递了 a 作为参数。这里传递的 a 是变量 a 的副本,而不是引用本身。
t1.join();: 等待线程 t1 执行完毕。
cout << a << endl;: 输出 a 的值,仍然是 10,因为 ThreadFunc1 函数中的 x 只修改了其副本,没有影响到外部变量 a。
thread t2(ThreadFunc1, std::ref(a));: 这里使用了 std::ref(a),将 a 的引用传递给 ThreadFunc1 函数。这样,ThreadFunc1 函数中的 x 就直接指向了外部变量 a。因此,修改 x 会影响外部变量 a。
ThreadFunc2(int* x): 这个函数接受一个指向整型的指针 x 作为参数。
thread t3(ThreadFunc2, &a);: 创建了一个线程 t3,将 ThreadFunc2 函数指针作为线程函数,并传递了 a 的地址作为参数。这样,ThreadFunc2 函数中的 x 指向了外部变量 a。
总结:
-
如果你直接将变量作为参数传递给线程函数,线程函数会修改一个副本,不会影响到外部变量。
-
如果你希望线程函数修改外部变量,需要使用 std::ref() 或指针,将外部变量的引用或地址传递给线程函数。
注意:如果是类成员函数作为线程参数时,必须将this作为线程函数参数。
三、原子性操作库(atomic)
多线程最主要的问题是共享数据带来的问题(即线程安全)。如果共享数据都是只读的,那么没问 题,因为只读操作不会影响到数据,更不会涉及对数据的修改,所以所有线程都会获得同样的数 据。但是,当一个或多个线程要修改共享数据时,就会产生很多潜在的麻烦。比如:
int x = 0;
void Print(int n)
{
for (size_t i = 0; i < n; i++)
{
x++;
}
}
int main()
{
// 此时两个线程并发运行
thread t1(Print, 1000);
thread t2(Print, 2000);
// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
t1.join();
t2.join();
// 此时值出现的结果就可能出错
// ++操作不保证原子性
cout << x << endl;
return 0;
}
我们来看一下运行结果:
这段代码的结果运行不对的原因在于 对 x 的增量操作 x++ 不是原子操作,在多线程环境下会导致 数据竞争,导致最终的输出结果不正确。
x++ 非原子操作: 在 C++ 中,x++ 操作是一个复合操作,它包含以下步骤:
读取 x 的当前值。
将 x 的值加 1。
将新的值写回 x。
C++98中传统的解决方式:可以对共享修改的数据可以加锁保护。
int x = 0;
mutex mux; // 定义一把全局锁
void Print(int n)
{
// 不能在这里定义锁
// 因为栈内定义的锁每个线程都有一把,并不是唯一的
mux.lock();
// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
for (size_t i = 0; i < n; i++)
{
x++;
}
mux.unlock();
}
int main()
{
// 此时两个线程并发运行
thread t1(Print, 10);
thread t2(Print, 20);
// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
t1.join();
t2.join();
// 此时值出现的结果就可能出错
// ++操作不保证原子性
cout << x << endl;
return 0;
}
此时我们通过加锁,就能保证++操作不会被打断,从而能够保证结果的正确性。
但是我们上面加锁的地方是在for循环外面,也就意味着一个线程执行完了x++操作后,才会轮到下一个线程,因为每次只有一个线程可以获取锁,然后执行完整个 for 循环才会释放锁。其实这相当于串行运行了,但是我们之前学习到要让锁的粒度尽可以细,什么意思呢?将锁的范围尽可能缩小到真正需要保护的代码段。 这样可以减少锁的竞争,提高并发性能,所以我们可以将加锁与解锁操作加入到for循环之内。
int x = 0;
mutex mux; // 定义一把全局锁
void Print(int n)
{
// 不能在这里定义锁
// 因为栈内定义的锁每个线程都有一把,并不是唯一的
// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
for (size_t i = 0; i < n; i++)
{
mux.lock();
x++;
mux.unlock();
}
}
int main()
{
// 此时两个线程并发运行
thread t1(Print, 10);
thread t2(Print, 20);
// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
t1.join();
t2.join();
// 此时值出现的结果就可能出错
// ++操作不保证原子性
cout << x << endl;
return 0;
}
此时我们来看结果,发现依然是正确的
锁的粒度细化的好处:
减少锁竞争: 多个线程竞争同一个锁的可能性降低,因为锁的范围更小。
提高并发性能: 多个线程可以更频繁地获得锁,提高程序的整体执行效率。
注意事项:
锁的粒度过细可能会导致性能下降: 如果锁的粒度太细,频繁地加锁和解锁会增加系统开销,反而会降低程序性能。
选择合适的锁粒度需要根据具体情况进行权衡: 需要根据程序的逻辑、数据访问模式等因素来确定合适的锁粒度。
如果我们这里不想使用全局变量x和全局锁,我们也可以设置成局部的,然后通过线程的参数传递过去。
void Print(int n, int& x, mutex& mtx)
{
// 不能在这里定义锁
// 因为栈内定义的锁每个线程都有一把,并不是唯一的
// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
mtx.lock();
for (size_t i = 0; i < n; i++)
{
x++;
}
mtx.unlock();
}
int main()
{
int x = 0;
mutex mtx;
// 此时两个线程并发运行
thread t1(Print, 10, x, mtx);
thread t2(Print, 20, x, mtx);
// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
t1.join();
t2.join();
// 此时值出现的结果就可能出错
// ++操作不保证原子性
cout << x << endl;
return 0;
}
但是此时我们编译错误了,为什么呢?线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的,使用 std::ref() 或指针,将外部变量的引用或地址传递给线程函数。
void Print(int n, int& x, mutex& mtx)
{
// 不能在这里定义锁
// 因为栈内定义的锁每个线程都有一把,并不是唯一的
// 变量i是线程安全的,因为i是栈内的变量,各种拥有,互不影响
mtx.lock();
for (size_t i = 0; i < n; i++)
{
x++;
}
mtx.unlock();
}
int main()
{
int x = 0;
mutex mtx;
// 此时两个线程并发运行
thread t1(Print, 10, ref(x), ref(mtx));
thread t2(Print, 20, ref(x), ref(mtx));
// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
t1.join();
t2.join();
// 此时值出现的结果就可能出错
// ++操作不保证原子性
cout << x << endl;
return 0;
}
但是这里也比较麻烦,我们可以发现thread的构造函数可以传入可调用对象,所以我们就可以写一个lambda表达式,在捕捉列表中对变量 x 和 锁 mtx 进行引用捕捉。通过引用捕获,可以轻松地共享 x 和 mtx 变量,避免了传递参数的麻烦。
int main()
{
int x = 0;
mutex mtx;
auto Func = [&x, &mtx](int n)
{
mtx.lock();
for (size_t i = 0; i < n; i++)
{
x++;
}
mtx.unlock();
};
// 此时两个线程并发运行
thread t1(Func, 10);
thread t2(Func, 20);
// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
t1.join();
t2.join();
// 此时值出现的结果就可能出错
// ++操作不保证原子性
cout << x << endl;
return 0;
}
虽然加锁可以解决,但是加锁有一个缺陷就是:只要一个线程在对x++时,其他线程就会被阻塞,会影响程序运行的效率,而且锁如果控制不好,还容易造成死锁。因此C++11中引入了原子操作。所谓原子操作:即不可被中断的一个或一系列操作,C++11引入 的原子操作类型,使得线程间数据的同步变得非常高效。
注意:需要使用以上原子操作变量时,必须添加头文件
# include <atomic>
int main()
{
atomic<int> x = 0; // cas 原子操作
atomic<int> x{ 0 }; // cas 原子操作
auto Func = [&](int n)
{
for (size_t i = 0; i < n; i++)
{
++x;
}
};
// 此时两个线程并发运行
thread t1(Func, 10);
thread t2(Func, 20);
// 这里需要回收线程,否则主线程退出,从线程依然运行导致程序报错
t1.join();
t2.join();
// ++操作保证原子性
cout << x << endl;
return 0;
}
在C++11中,程序员不需要对原子类型变量进行加锁解锁操作,线程能够对原子类型变量互斥的 访问。 更为普遍的,程序员可以使用atomic类模板,定义出需要的任意原子类型。
atmoic<T> t; // 声明一个类型为T的原子类型变量t
注意:原子类型通常属于"资源型"数据,多个线程只能访问单个原子类型的拷贝,因此在C++11 中,原子类型只能从其模板参数中进行构造,不允许原子类型进行拷贝构造、移动构造以及 operator=等,为了防止意外,标准库已经将atmoic模板类中的拷贝构造、移动构造、赋值运算符重载默认删除掉了。
#include <atomic>
int main()
{
atomic<int> a1(0);
//atomic<int> a2(a1); // 编译失败
atomic<int> a2(0);
//a2 = a1; // 编译失败
return 0;
}
四、lock_guard与unique_lock
在多线程环境下,如果想要保证某个变量的安全性,只要将其设置成对应的原子类型即可,即高 效又不容易出现死锁问题。但是有些情况下,我们可能需要保证一段代码的安全性,那么就只能 通过锁的方式来进行控制。
比如:一个线程对变量number进行加一100次,另外一个减一100次,每次操作加一或者减一之 后,输出number的结果,要求:number最后的值为1。
#include <thread>
#include <mutex>
int number = 1;
mutex g_lock;
int ThreadProc1()
{
for (int i = 0; i < 100; i++)
{
g_lock.lock();
++number;
cout << "thread 1 :" << number << endl;
g_lock.unlock();
}
return 0;
}
int ThreadProc2()
{
for (int i = 0; i < 100; i++)
{
g_lock.lock(); --number;
cout << "thread 2 :" << number << endl;
g_lock.unlock();
}
return 0;
}
int main()
{
thread t1(ThreadProc1);
thread t2(ThreadProc2);
t1.join();
t2.join();
cout << "number:" << number << endl;
system("pause");
return 0;
}
上述代码的缺陷:锁控制不好时,可能会造成死锁,最常见的比如在锁中间代码返回,或者在锁 的范围内抛异常。因此:C++11采用RAII的方式对锁进行了封装,即lock_guard和unique_lock。
4.1. mutex的种类
在C++11中,Mutex总共包了四个互斥量的种类:
1). std::mutex
C++11提供的最基本的互斥量,该类的对象之间不能拷贝,也不能进行移动。mutex最常用 的三个函数:
函数名 | 函数功能 |
lock() | 上锁:锁住互斥量 |
unlock() | 解锁:释放对互斥量的所有权 |
try_lock() | 尝试锁住互斥量,如果互斥量被其他线程占有,则当前线程也不会被阻塞 |
注意,线程函数调用lock()时,可能会发生以下三种情况:
- 如果该互斥量当前没有被锁住,则调用线程将该互斥量锁住,直到调用 unlock之前, 该线程一直拥有该锁
- 如果当前互斥量被其他线程锁住,则当前的调用线程被阻塞住
- 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)
线程函数调用try_lock()时,可能会发生以下三种情况:
- 如果当前互斥量没有被其他线程占有,则该线程锁住互斥量,直到该线程调用 unlock 释放互斥量
- 如果当前互斥量被其他线程锁住,则当前调用线程返回 false,而并不会被阻塞掉
- 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)
2). std::recursive_mutex
其允许同一个线程对互斥量多次上锁(即递归上锁),来获得对互斥量对象的多层所有权, 释放互斥量时需要调用与该锁层次深度相同次数的 unlock(),除此之外, std::recursive_mutex 的特性和 std::mutex 大致相同。
3). std::timed_mutex
比 std::mutex 多了两个成员函数,try_lock_for(),try_lock_until() 。
- try_lock_for()
接受一个时间范围,表示在这一段时间范围之内线程如果没有获得锁则被阻塞住(与 std::mutex 的 try_lock() 不同,try_lock 如果被调用时没有获得锁则直接返回 false),如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超 时(即在指定时间内还是没有获得锁),则返回 false。
- try_lock_until()
接受一个时间点作为参数,在指定时间点未到来之前线程如果没有获得锁则被阻塞住, 如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指 定时间内还是没有获得锁),则返回 false。
4). std::recursive_timed_mutex
4.2. lock_guard
std::lock_gurad 是 C++11 中定义的模板类。定义如下:
// 支持各种锁
template<class Lock>
class LockGuard
{
public:
LockGuard(Lock& lock)
:_lock(lock)
{
_lock.lock();
}
LockGuard(const LockGuard&) = delete;
LockGuard& operator= (const LockGuard&) = delete;
~LockGuard()
{
_lock.unlock();
}
private:
Lock& _lock; //引用的成员变量必须在初始化列表进行初始化
};
通过上述代码可以看到,LockGuard类模板主要是通过RAII的方式,对其管理的互斥量进行了封 装,在需要加锁的地方,只需要用上述介绍的任意互斥体实例化一个LockGuard,调用构造函数 成功上锁,出作用域前,LockGuard对象要被销毁,调用析构函数自动解锁,可以有效避免死锁 问题。
lock_guard的缺陷:太单一,用户没有办法对该锁进行控制,因此C++11又提供了 unique_lock。
4.3. unique_lock
与lock_gard类似,unique_lock类模板也是采用RAII的方式对锁进行了封装,并且也是以独占所 有权的方式管理mutex对象的上锁和解锁操作,即其对象之间不能发生拷贝。在构造(或移动 (move)赋值)时,unique_lock 对象需要传递一个 Mutex 对象作为它的参数,新创建的 unique_lock 对象负责传入的 Mutex 对象的上锁和解锁操作。使用以上类型互斥量实例化 unique_lock的对象时,自动调用构造函数上锁,unique_lock对象销毁时自动调用析构函数解锁,可以很方便的防止死锁问题。
与lock_guard不同的是,unique_lock更加的灵活,提供了更多的成员函数:
- 上锁/解锁操作:lock、try_lock、try_lock_for、try_lock_until和unlock
- 修改操作:移动赋值、交换(swap:与另一个unique_lock对象互换所管理的互斥量所有权)、释放(release:返回它所管理的互斥量对象的指针,并释放所有权)
- 获取属性:owns_lock(返回当前对象是否上了锁)、operator bool()(与owns_lock()的功能相 同)、mutex(返回当前unique_lock所管理的互斥量的指针)。
五、支持两个线程交替打印,一个打印奇数,一个打印偶数
本节主要演示了condition_variable的使用,condition_variable熟悉我们linux课程已经讲过了,他们用来进行线程之间的互相通知。condition_variable和Linux posix的条件变量并没有什么大的区别,主要还是面向对象实现的。条件变量的文档如下:cplusplus.com/reference/condition_variable/
#include <thread>
#include <mutex>
#include <condition_variable>
using namespace std;
void two_thread_print()
{
mutex mtx; // 锁
int n = 100;
bool flag = true;
condition_variable c; // 条件变量
// 输出偶数
thread t1([&]() {
int i = 0;
while (i < n)
{
unique_lock<mutex> lock(mtx);
while (!flag)
c.wait(lock); // 先被阻塞,wait使用会释放锁
cout << "Thread 1: " << i << endl;
flag = false;
i += 2; // 偶数
c.notify_one(); // 会自动申请锁
}
});
// 输出奇数
thread t2([&]() {
int j = 1;
while (j < n)
{
unique_lock<mutex> lock(mtx);
while(flag)
c.wait(lock); // 先被阻塞,wait使用会释放锁
cout << "Thread 2: " << j << endl;
j += 2; // 奇数
flag = true;
c.notify_one(); // 会自动申请锁
}
});
t1.join();
t2.join();
}
int main()
{
two_thread_print();
return 0;
}
我们来看一下结果:
本章结束啦!!!