1. 锁:mutex
锁,是生活中应用十分广泛的一种工具。锁的本质属性是为事物提供“访问保护”,例如:大门上的锁,是为了保护房子免于不速之客的到访;自行车的锁,是为了保护自行车只有owner才可以使用;保险柜上的锁,是为了保护里面的合同和金钱等重要东西……
在c++等高级编程语言中,锁也是用来提供“访问保护”的,不过被保护的东西不再是房子、自行车、金钱,而是内存中的各种变量。此外,计算机领域对于“锁”有个响亮的名字——mutex(互斥量),学过操作系统的同学对这个名字肯定很熟悉。
当访问共享数据前,使用互斥量将相关数据锁住,再当访问结束后,再将数据解锁。线程库需要保证,当一个线程使用特定互斥量锁住共享数据时,其他的线程想要访问锁住的数据,都必须等到之前那个线程对数据进行解锁后,才能进行访问。这就保证了所有线程能看到共享数据,而不破坏不变量。
Mutex,互斥量,就是互斥访问的量。这种东东只在多线程编程中起作用,在单线程程序中是没有什么用处的。从c++11开始,c++提供了std::mutex
类型,对于多线程的加锁操作提供了很好的支持。下面看一个简单的例子,对于mutex形成一个直观的认识。
Demo1——无锁的情况
假定有一个全局变量counter,启动两个线程,每个都对该变量自增10000次,最后输出该变量的值。
在第一个demo中,我们不加锁,代码文件保存为:mutex_demo1_no_mutex.cpp
#include <iostream>
#include <thread>
#include <vector>
#include <mutex>
#include <chrono>
#include <stdexcept>
int counter = 0;
void increase(int time) {
for (int i = 0; i < time; i++) {
// 当前线程休眠1毫秒
std::this_thread::sleep_for(std::chrono::milliseconds(1));
counter++;
}
}
int main(int argc, char** argv) {
std::thread t1(increase, 10000);
std::thread t2(increase, 10000);
t1.join();
t2.join();
std::cout << "counter:" << counter << std::endl;
return 0;
}
为了显示多线程竞争导致结果不正确的现象,在每次自增操作的时候都让当前线程休眠1毫秒
如果没有多线程编程的相关经验,我们可能想当然的认为最后的counter为20000,如果这样想的话,那就大错特错了。下面是两次实际运行的结果:
[root@2d129aac5cc5 demo]# ./mutex_demo1_no_mutex
counter:19997
[root@2d129aac5cc5 demo]# ./mutex_demo1_no_mutex
counter:19996
出现上述情况的原因是:自增操作"counter++"不是原子操作,而是由多条汇编指令完成的。多个线程对同一个变量进行读写操作就会出现不可预期的操作。以上面的demo1作为例子:假定counter当前值为10,线程1读取到了10,线程2也读取到了10,分别执行自增操作,线程1和线程2分别将自增的结果写回counter,不管写入的顺序如何,counter都会是11,但是线程1和线程2分别执行了一次自增操作,我们期望的结果是12!!!!!
轮到mutex上场。
Demo2——加锁的情况
定义一个std::mutex
对象用于保护counter变量。对于任意一个线程,如果想访问counter,首先要进行"加锁"操作,如果加锁成功,则进行counter的读写,读写操作完成后释放锁(重要!!!); 如果“加锁”不成功,则线程阻塞,直到加锁成功。
#include <iostream>
#include <thread>
#include <vector>
#include <mutex>
#include <chrono>
#include <stdexcept>
int counter = 0;
std::mutex mtx; // 保护counter
void increase(int time) {
for (int i = 0; i < time; i++) {
mtx.lock();
// 当前线程休眠1毫秒
std::this_thread::sleep_for(std::chrono::milliseconds(1));
counter++;
mtx.unlock();
}
}
int main(int argc, char** argv) {
std::thread t1(increase, 10000);
std::thread t2(increase, 10000);
t1.join();
t2.join();
std::cout << "counter:" << counter << std::endl;
return 0;
}
上述代码保存文件为:mutex_demo2_with_mutex.cpp
。先来看几次运行结果:
[root@2d129aac5cc5 demo]# ./mutex_demo2_with_mutex
counter:20000
[root@2d129aac5cc5 demo]# ./mutex_demo2_with_mutex
counter:20000
[root@2d129aac5cc5 demo]# ./mutex_demo2_with_mutex
counter:20000
这次运行结果和我们预想的一致,原因就是“利用锁来保护共享变量”,在这里共享变量就是counter(多个线程都能对其进行访问,所以就是共享变量啦)。
简单总结一些std::mutex
:
- 对于
std::mutex
对象,任意时刻最多允许一个线程对其进行上锁; mtx.lock()
:调用该函数的线程尝试加锁。如果上锁不成功,即:其它线程已经上锁且未释放,则当前线程block。如果上锁成功,则执行后面的操作,操作完成后要调用mtx.unlock()
释放锁,否则会导致死锁的产生;mtx.unlock()
:释放锁;std::mutex
还有一个操作:mtx.try_lock()
,字面意思就是:“尝试上锁”,与mtx.lock()
的不同点在于:如果上锁不成功,当前线程不阻塞。
2. lock_guard
虽然std::mutex
可以对多线程编程中的共享变量提供保护,但是直接使用std::mutex
的情况并不多。因为仅使用std::mutex
有时候会发生死锁。回到上边的例子,考虑这样一个情况:假设线程1上锁成功,线程2上锁等待。但是线程1上锁成功后,抛出异常并退出,没有来得及释放锁,导致线程2“永久的等待下去”(线程2:我的心在等待永远在等待……),此时就发生了死锁。给一个发生死锁的 :
Demo3——死锁的情况(仅仅为了演示,不要这么写代码哦)
为了捕捉抛出的异常,我们重新组织一下代码,代码保存为:mutex_demo3_dead_lock.cpp
:
#include <iostream>
#include <thread>
#include <vector>
#include <mutex>
#include <chrono>
#include <stdexcept>
int counter = 0;
std::mutex mtx; // 保护counter
void increase_proxy(int time, int id) {
for (int i = 0; i < time; i++) {
mtx.lock();
// 线程1上锁成功后,抛出异常:未释放锁
if (id == 1) {
throw std::runtime_error("throw excption....");
}
// 当前线程休眠1毫秒
std::this_thread::sleep_for(std::chrono::milliseconds(1));
counter++;
mtx.unlock();
}
}
void increase(int time, int id) {
try {
increase_proxy(time, id);
}
catch (const std::exception& e){
std::cout << "id:" << id << ", " << e.what() << std::endl;
}
}
int main(int argc, char** argv) {
std::thread t1(increase, 10000, 1);
std::thread t2(increase, 10000, 2);
t1.join();
t2.join();
std::cout << "counter:" << counter << std::endl;
return 0;
}
执行后,结果如下图所示:
[root@2d129aac5cc5 demo]# ./mutex_demo3_dead_lock
id:1, throw excption....
程序并没有退出,而是永远的“卡”在那里了,也就是发生了死锁。
那么这种情况该怎么避免呢? 这个时候就需要std::lock_guard
登场了。
std::lock_guard
只有构造函数和析构函数。简单的来说:当调用构造函数时,会自动调用传入的对象的lock()
函数,而当调用析构函数时,自动调用unlock()
函数(这就是所谓的RAII,读者可自行搜索)。其有以下特点:
- 创建即加锁,作用域结束自动析构并解锁,无需手动解锁;
- 不能中途解锁;
- 不能复制;
我们修改一下demo3:
Demo4——避免死锁,lock_guard
demo4保存为:mutex_demo4_lock_guard.cpp
#include <iostream>
#include <thread>
#include <vector>
#include <mutex>
#include <chrono>
#include <stdexcept>
int counter = 0;
std::mutex mtx; // 保护counter
void increase_proxy(int time, int id) {
for (int i = 0; i < time; i++) {
// std::lock_guard对象构造时,自动调用mtx.lock()进行上锁
// std::lock_guard对象析构时,自动调用mtx.unlock()释放锁
std::lock_guard<std::mutex> lk(mtx);
// 线程1上锁成功后,抛出异常:未释放锁
if (id == 1) {
throw std::runtime_error("throw excption....");
}
// 当前线程休眠1毫秒
std::this_thread::sleep_for(std::chrono::milliseconds(1));
counter++;
}
}
void increase(int time, int id) {
try {
increase_proxy(time, id);
}
catch (const std::exception& e){
std::cout << "id:" << id << ", " << e.what() << std::endl;
}
}
int main(int argc, char** argv) {
std::thread t1(increase, 10000, 1);
std::thread t2(increase, 10000, 2);
t1.join();
t2.join();
std::cout << "counter:" << counter << std::endl;
return 0;
}
执行上述代码,结果为:
[root@2d129aac5cc5 demo]# ./mutex_demo4_lock_guard
id:1, throw excption....
counter:10000
结果符合预期。所以,推荐使用std::mutex
和std::lock_guard
搭配使用,避免死锁的发生。
3. std::lock_guard的第二个构造函数
实际上,std::lock_guard
有两个构造函数,具体的(参考:cppreference):
explicit lock_guard( mutex_type& m ); (1) (since C++11)
lock_guard( mutex_type& m, std::adopt_lock_t t ); (2) (since C++11)
lock_guard( const lock_guard& ) = delete; (3) (since C++11)
在demo4中我们使用了第1个构造函数,第3个为拷贝构造函数,定义为删除函数。这里我们来重点说一下第2个构造函数。
第2个构造函数有两个参数,其中第二个参数类型为:std::adopt_lock_t
。这个构造函数假定:当前线程已经上锁成功,所以不再调用lock()
函数。这里不再给出具体的例子,如果想了解这种构造函数是如何工作的,可以看这里,链接中给的例子很简洁。
4. 其他类型互斥量
接下来介绍另外两种互斥量: std::recursive_mutex
和 shared_mutex
:
4.1 recursive_mutex
recursive_mutex
和 mutex
行为几乎一致,区别在于:提供排他性递归所有权语义,已经获得一个递归互斥体的所有权的线程允许在同一个互斥体上再次调用 lock()
和 try_lock()
,调用线程调用 unlock
的次数应该等于获的这个递归互斥锁的次数,在匹配次数时解锁。
比如:函数A需要获取锁mutex
,函数B也需要获取锁mutex
,同时函数A中还会调用函数B。如果使用 std::mutex
必然会造成死锁。但是使用 std::recursive_mutex
就可以解决这个问题。
4.2 shared_mutex
(C++ 17)
shared_mutex
类是一个同步原语,可用于保护共享数据不被多个线程同时访问。以便于独占访问的其他互斥类型不同,shared_mutex
拥有二个访问级别:
共享 - 多个线程能共享同一互斥的所有权。
独占性 - 仅一个线程能占有互斥。
若一个线程已获取独占性锁(通过 lock 、 try_lock ),则无其他线程能获取该锁(包括共享的)。仅当任何线程均未获取独占性锁时,共享锁能被多个线程获取(通过 lock_shared 、 try_lock_shared )。在一个线程内,同一时刻只能获取一个锁(共享或独占性)。共享互斥体在能由任何数量的线程同时读共享数据,但一个线程只能在无其他线程同时读写时写同一数据时特别有用。
排他性锁定:
lock()
: 锁定互斥,若互斥则阻塞try_lock()
: 尝试锁定互斥,若互斥不可用则返回unlock()
: 解锁互斥
共享锁定:
lock_shared()
:为共享所有权锁定互斥,若互斥不可用则阻塞try_lock_shared()
: 尝试为共享所有权锁定互斥,若互斥不可用则返回unlock_shard()
: 解锁互斥
5. std::unique_lock介绍
std::unique_lock
比std::lock_guard
更灵活,这种灵活性主要体现在以下几点:
lock_guard
在构造时或者构造前(std::adopt_lock
)就已经获取互斥锁,并且在作用域内保持获取锁的状态,直到作用域结束;而unique_lock
在构造时或者构造后(std::defer_lock
)获取锁,在作用域范围内可以手动获取锁和释放锁,作用域结束时如果已经获取锁则自动释放锁。lock_guard
锁的持有只能在lock_guard
对象的作用域范围内,作用域范围之外锁被释放,而unique_lock
对象支持移动操作,可以将unique_lock
对象通过函数返回值返回,这样锁就转移到外部unique_lock
对象中,延长锁的持有时间。
std::unique_lock
比 std::lock_guard
灵活很多,效率上差一点,内存占用多一点,可移动,但不可复制。
int n;
std::mutex some_mutex;
void prepare_data()
{
cout << n++ << endl;
}
void do_something()
{
cout << n++ << endl;
}
std::unique_lock<std::mutex> get_lock()
{
std::unique_lock<std::mutex> lk(some_mutex);//与lock_guard相同,构造时获取锁
cout << "owns_lock? " << lk.owns_lock() << endl;//1
prepare_data();
return lk;
}
int main()
{
//unique_lock基本使用
std::mutex mutex2;
std::unique_lock<std::mutex> lock2(mutex2, std::defer_lock);//告诉构造函数暂不获取锁
cout << "owns_lock? " << lock2.owns_lock() << endl;//0
lock2.lock();//手动获取锁
std::cout << "owns_lock? " << lock2.owns_lock() << endl;//1
lock2.unlock();//手动解锁
cout << "owns_lock? " << lock2.owns_lock() << endl;//0
//锁所有权转移到函数外部
std::unique_lock<std::mutex> lk(get_lock());//
do_something();
}
//析构
//lock2未获取锁mutex2,因此不会调用unlock
//lk对象持有锁some_mutex,调用unlock
由于unique_lock
对象需要根据当前对象是否已经持有锁还是未持有进行判断从而执行适当的操作,因此比lock_guard
占用空间稍大一点,效率稍低一点,std::unique_lock.owns_lock
返回当前是否持有锁。
通常来说不应该在持有锁的期间执行消耗时间长的操作,此时unique_lock
更加灵活,可以随时unlock
,避免不相关的操作期间仍然持有锁。
std::unique_lock<std::mutex> my_lock(the_mutex);
some_class data_to_process = get_next_data_chunk();
my_lock.unlock();
result_type result = process(data_to_process);
my_lock.lock();
write_result(data_to_process, result);
总结:
简单来说:相比于std::lock_guard
, std::unique_lock
提供了更多的接口,也就使其更加灵活,但性能方面也会有些受损。
补充:
- RAII 是 resource acquisition is initialization 的缩写,意为“资源获取即初始化”。它是 C++ 之父 Bjarne Stroustrup 提出的设计理念,其核心是:把资源和对象的生命周期绑定,对象创建获取资源,对象销毁释放资源。
- 在 RAII 的指导下,C++ 把底层的资源管理问题提升到了对象生命周期管理的更高层次。
- RALL机制是通过利用对象的自动销毁,使得资源也具有了生命周期,有了自动销毁(自动回收)的功能。
参考: