本文试图自底向上说明CAS。
一句话描述:
看锁是否被占:如果没被占,就把他给占了,并返回成功;否则锁已经被占了,返回失败。
占与没占,用不同的数组表示即可。
#define lock(lock) (*(lock) == x && cas(lock, x, y))
#define unlock(lock) *(lock) = x
static inline int cas(ngx_atomic_t *lock, int old, int set)
{
char res;
__asm__ volatile (
" lock; "
" cmpxchgl %3, %1; "
" sete %0; "
: "=b" (res) : "m" (*lock), "a" (old), "r" (set) : "cc", "memory");
return res;
}
volatile g_lock = x;
g_lock初始化为x,x表示g_lock锁没有被抢占,y表示被抢占,为使cas更具一般性,x/y可以为任意值。
看函数cas(),用内联汇编实现,lock前缀表明锁总线,cmpxchg是一条指令,但是需要几个步骤来执行,所以虽然内存单元同一时刻只有一个核可以访问,但是为了避免多核同时cmpxchg时各步骤之间产生乱序,所以还是要用lock前缀让cmpxchg在执行时把总线给锁住。
cas()里这段汇编的意思就是:
1、锁总线;
1.1、比较eax和*lock是否相同,如果相同,置ZF为1,再转到1.1.1;如果不相同,置ZF为0,再转到1.1.2;
1.1.1、把*lock赋值为set
1.1.2、这步忽略吧(把set改为*lock)
2、把res赋值为ZF
注:必须把old写到eax寄存器中( "a" (old) )。
所以cas()最后返回的res,如果为0,则表明g_lock原本已经不是x了,锁已经被抢占了。
如果为1,则表明g_lock原本等于x,也就是之前没有被抢占,然后我已经把他置为y了,表示我把他给抢占了。
你调用cas()时,可以封装个while循环,起自旋锁的作用,具体说,当返回res为0时继续循环,直到返回res为1,表示抢锁成功。