内核同步介绍
本章的意义何在?
因为目前内核支持多处理器,所以共享资源一定要防止并发访问,如果多个执行线程同时访问和操作数据,就可能发生各线程之间相互覆盖共享数据情况,造成被访问数据处于不一致状态,因此我们要了解Linux内核如何解决同步问题和防止产生竞争条件。
1 临界区和竞争条件
临界区:访问和操纵共享数据的代码段。
为了避免在临界区中并发访问,我们必须保证这些代码原子地执行,即操作在执行结束前不可被打断。但是如果发生两个执行线程处于同一个临界区中同时执行,就称为 竞争条件 ,这种情况可能会导致错误,所以避免并发和防止竞争条件称为同步。
2 加锁
为了防止竞争条件,我们需要能确保一次有且仅有一个线程对数据结构进行操作,或者当另一个线程在对临界区标记时,就禁止(锁定)其他的访问。
而我们可以利用锁机制(在其他很多地方都用到这种机制,比如数据库,只要是访问数据都可能用到)。
把这里的锁当成“门锁”,门后房间当成“临界区”。当一个线程进入房间后,门会被锁住,其他线程进不来,只有当前线程结束对共享数据的访问后,走出房门打开门锁,其他线程才能进入并锁上。这样线程持有锁,锁可以保护数据。
而锁的使用是非强制的,程序员自愿的,但是最好在对共享数据访问时使用锁。
锁采用原子操作实现的,即不会被打断。
造成并发执行的原因
因为用户程序会被调度程序抢占和重新调度。内核中可能造成并发执行的原因如下:
- 中断
- 软中断和tasklet
- 内核抢占
- 睡眠及与用户空间的同步
- 对称多处理:两个或多个处理器可以同时执行代码。
我们的目的就是发现上述的潜在并发执行的可能,并有意识地采取措施来防止并发执行。
用锁保护共享资源很简单,困难在于找到真正需要共享的数据和相应临界区。我们希望在编写代码的开始阶段就设计恰当的锁。
需要保护什么?
因为任何可能被并发访问的代码都几乎无例外需要保护,所以找哪些代码不需要保护会更容易些。
什么数据需要加锁呢?
如果有其他执行线程可以访问这些数据,那么就给这些数据加锁;如果任何其他什么东西都能看到它,就锁住它。
3 死锁
死锁产生的原因:有一个或多个执行线程和一个或多个资源,每个线程都在等待其中的一个资源,但所有资源都已经被占用了。所有线程都在相互等待,但它们永远不释放资源。
4 争用和扩展性
锁的争用:当锁正被占用时,其他线程试图获得该锁。
扩展性:对系统可扩展程度的一个量度。
内核同步方法
1 原子操作
原子操作是其他同步方法的基石,它可以保证指令以原子的方式执行——执行不被打断。
Linux内核提供了两组原子操作接口:
- 对整数进行操作
只能对atomic_t
类型的数据进行处理。
typedef struct{
volatile int counter;
}atomic_t;
- 对单独的位进行操作
位操作函数是对普通的内存地址进行操作。
2 自旋锁
Linux内核中最常见的锁是自旋锁,它最多只能被一个可执行线程持有。
如果一个执行线程试图获得一个被已经持有的自旋锁,那么该线程就会一直进行忙循环—旋转—等待锁重新可用。如果锁未被争用,请求锁的执行线程便能立刻得到它,继续执行。
自旋锁可以防止多于一个的执行线程同时进入临界区。
自旋锁的要点:一个被争用的自旋锁使得请求它的线程在等待锁重新可用时自旋(浪费处理器时间),所以自旋锁不应该被长时间持有。所以我们让持有自旋锁的时间应尽可能的短。
自旋锁的使用形式如下:
DEFINE_SPINLOCK(mr_lock);
spin_lock(&mr_lock);
/*临界区*/
spin_unlock(&mr_lock);
注意:自旋锁是不可递归的。
3 读写自旋锁
有时锁可明确分别用于读取和写入两个场景。Linux内核提供了专门的读写自旋锁。
一个或多个读任务可以并发地持有读写锁;
用于写的锁最多只能被一个写任务持有,而且此时不能有并发的读操作。
读写自旋锁的初始化:
DEFINE_RWLOCK(mr_rwlock);
在读者的代码分支中使用如下函数:
read_lock(&mr_rwlock);
/*临界区(只读)...*/
read_unlock(&mr_rwlock);
而在写者的代码分支中使用如下函数:
write_lock(&mr_rwlock);
/*临界区(只读)...*/
write_unlock(&mr_rwlock);
如果加锁时间不长且代码不会睡眠,利用自旋锁是最佳选择。
如果加锁时间可能很长或者代码在持有锁时有可能睡眠,那么可使用信号量来完成加锁功能。
4 信号量
Linux信号量是一种睡眠锁,如果有个任务试图获得一个不可用的信号量时,信号量会将其推进一个等待队列,让其睡眠。当持有的信号量可用后,处于等待队列的那个任务将被唤醒,并获得信号量。
信号量分为计数信号量和二值信号量(也称互斥信号量)。
静态信号量声明方法:
struct semaphore name;
sema_init(&name, count); // name为信号量变量名,count为信号量的使用数量
创建互斥信号量的快捷方法如下:
static DECLARE_MUTEX(name);
动态创建信号量为:
sema_init(sem, count);
使用信号量:
/*定义并声明一个信号量mr_sem,用于信号量计数*/
static DECLARE_MUTEX(mr_sem);
/*down_interruptible 试图获取信号量*/
if(down_interruptible(&mr_sem)){
//信号量还未获取
}
/*临界区*/
/*释放给定的信号量*/
up(&mr_sem);
5 读写信号量
和自旋锁一样,信号量也有区分读—写访问的可能。
创建静态声明的读-写信号量:
static DECLARE_RWSEM(name);
创建动态读写信号量:
init_rwsem(struct rw_semaphore *sem);
所有读写信号量都是互斥信号量。
6 互斥体
“互斥体”指的是任何可以睡眠的强制互斥锁,而在最新的Linux内核中,互斥体也用于一种实现互斥的特定睡眠锁,即互斥体是一种互斥信号。
什么场景使用什么锁: