分析Linux中Spinlock在ARM及X86平台上的实现

作者:刘洪涛,华清远见嵌入式学院讲师。

本文主要以2.6.22.6内核分析Linux中spinlock在ARM及X86平台上的实现(不同版本的内核实现形式会有一些差异,但原理大致相同)。此处默认大家已经熟悉了spinlock的使用,重点解释容易引起迷惑的体系结构相关的实现部分。

一、spin_lock(lock)的实现

/***include/linux/spinlock.h中***/

#if defined(CONFIG_SMP) || defined(CONFIG_DEBUG_SPINLOCK)
        //如果配置了SMP或配置自旋锁调试功能
        # include <linux/spinlock_api_smp.h>
        #else //如果是单处理器且不配置自旋锁调试功能
        # include <linux/spinlock_api_up.h>
        #endif
        ……
        #define spin_lock(lock) _spin_lock(lock)

1、如果是单处理器

/****include/linux/spinlock_api_up.h****/

#define _spin_lock(lock) __LOCK(lock)
        #define __LOCK(lock) /
            do { preempt_disable(); __acquire(lock); (void)(lock); } while (0)

    (1)preempt_disable():禁止抢占
            (2)__acquire(lock):在include/linux/compiler.h中有定义
        #ifdef __CHECKER__
        ……
        # define __acquire(x) __context__(x,1)
        # define __release(x) __context__(x,-1)
        #else
        ……
        # define __acquires(x)
        # define __releases(x)

这是一对用于sparse对代码检测的相互关联的函数定义,第一句表示要增加变量x的计数,增加量为1,第二句则正好相反,这个是用来函数编译的过程中。如果在代码中出现了不平衡的状况,那么在Sparse的检测中就会报警。如果要使用Sparse检测功能就需要安装sparse工具(参考相关安装方法),然后编译内核

#make zImage C=1 (C=1,只检测新编译的文件,C=2是查所有文件)
        Sparse会定义__CHECKER__,如果你没有使用sparse工具,__acquire(lock)则定义为空

    (3)(void)(lock):通过插入一个变量本身的求值表达式,使编译器不再报警,如:“variable 'lock' is defined but never used”。这种求值不会影响运行时的速度。

2、如果配置了SMP

/****include/linux/spinlock_api_smp.h中****/

void __lockfunc _spin_lock(spinlock_t *lock) __acquires(lock);

 /***kernel/spinlock.c***/

void __lockfunc _spin_lock(spinlock_t *lock)
        {
                preempt_disable();
                //关闭抢占
                spin_acquire(&lock->dep_map, 0, 0, _RET_IP_);
                //自旋锁调试用,在没有定义自旋锁调试的时候是空函数
                _raw_spin_lock(lock);
        }

/***include/linux/spinlock.h***/

#ifdef CONFIG_DEBUG_SPINLOCK
        extern void _raw_spin_lock(spinlock_t *lock);//在lib/spinlock_debug.c中实现
        #else //smp情况
        # define _raw_spin_lock(lock) __raw_spin_lock(&(lock)->raw_lock)

3、__raw_spin_lock在ARM处理器上的实现

/******include/asm-arm/spinlock_types.h***/

 typedef struct {
        volatile unsigned int lock;
        } raw_spinlock_t;

#define __RAW_SPIN_LOCK_UNLOCKED { 0 }

/******include/asm-arm/spinlock.h***/

#if __LINUX_ARM_ARCH__ < 6
        #error SMP not supported on pre-ARMv6 CPUs //ARMv6后,才有多核ARM处理器
        #endif
        ……
        static inline void __raw_spin_lock(raw_spinlock_t *lock)
        {
                unsigned long tmp;
                __asm__ __volatile__(
        "1: ldrex        %0, [%1]/n"
        //取lock->lock放在 tmp里,并且设置&lock->lock这个内存地址为独占访问
        "        teq %0, #0/n"
        //测试lock_lock是否为0,影响标志位z
        #ifdef CONFIG_CPU_32v6K
        "        wfene/n"
        #endif
        "        strexeq %0, %2, [%1]/n"
        //如果lock_lock是0,并且是独占访问这个内存,就向lock->lock里写入1,并向tmp返回0,同时清除独占标记
        "        teqeq %0, #0/n"
        //如果lock_lock是0,并且strexeq返回了0,表示加锁成功,返回
        " bne 1b"
        //如果上面的条件(1:lock->lock里不为0,2:strexeq失败)有一个符合,就在原地打转
                : "=&r" (tmp) //%0:输出放在tmp里,可以是任意寄存器
                : "r" (&lock->lock), "r" (1)
        //%1:取&lock->lock放在任意寄存器,%2:任意寄存器放入1
                : "cc"); //状态寄存器可能会改变
                smp_mb();
        }

上述代码关键在于LDREX和STREX指令的应用。DREX和STREX指令是在V6以后才出现的,代替了V6以前的swp指令。可以让bus监控LDREX和STREX指令之间有无其它CPU和DMA来存取过这个地址,若有的话STREX指令的第一个寄存器里设置为1(动作失败),若没有,指令的第一个寄存器里设置为0(动作成功)。

不仅是自旋锁用到LDREX和STREX指令,信号量的实现也是利用LDREX和STREX指令来实现的。

4、__raw_spin_lock在X86处理器上的实现

/******include/asm-i386/spinlock_types.h***/

typedef struct {
                unsigned int slock;
        } raw_spinlock_t;
        #define __RAW_SPIN_LOCK_UNLOCKED { 1 }

/******include/asm-i386/spinlock.h***/

static inline void __raw_spin_lock(raw_spinlock_t *lock)
        {
                asm volatile("/n1:/t"
                        LOCK_PREFIX " ; decb %0/n/t"
                // lock->slock减1
                        "jns 3f/n"
                //如果不为负.跳转到3f.3f后面没有任何指令,即为退出
                        "2:/t"
                        "rep;nop/n/t"
                //重复执行nop.nop是x86的小延迟函数
                        "cmpb $0,%0/n/t"
                        "jle 2b/n/t"
                //如果lock->slock不大于0,跳转到标号2,即继续重复执行nop
                        "jmp 1b/n"
                //如果lock->slock大于0,跳转到标号1,重新判断锁的slock成员
                        "3:/n/t"
                        : "+m" (lock->slock) : : "memory");
                }

在多处理器环境中 LOCK_PREFIX 实际被定义为 “lock”前缀。x86 处理器使用“lock”前缀的方式提供了在指令执行期间对总线加锁的手段。芯片上有一条引线 LOCK,如果在一条汇编指令(ADD, ADC, AND, BTC, BTR, BTS, CMPXCHG, CMPXCH8B, DEC, INC, NEG, NOT, OR, SBB, SUB, XOR, XADD, XCHG)前加上“lock” 前缀,经过汇编后的机器代码就使得处理器执行该指令时把引线 LOCK 的电位拉低,从而把总线锁住,这样其它处理器或使用DMA的外设暂时无法通过同一总线访问内存。

jns 汇编指令检查 EFLAGS 寄存器的 SF(符号)位,如果为 0,说明 slock 原来的值为 1,则线程获得锁,然后跳到标签 3 的位置结束本次函数调用。如果 SF 位为 1,说明 slock 原来的值为 0 或负数,锁已被占用。那么线程转到标签 2 处不断测试 slock 与 0 的大小关系,假如 slock 小于或等于 0,跳转到标签 2 的位置继续忙等待;假如 slock 大于 0,说明锁已被释放,则跳转到标签 1 的位置重新申请锁。

二、spin_unlock(lock)的实现

/***include/linux/spinlock.h***/

 #if defined(CONFIG_DEBUG_SPINLOCK) || defined(CONFIG_PREEMPT) || /
                !defined(CONFIG_SMP)
        # define spin_unlock(lock)                _spin_unlock(lock)
        ……
        #else
        # define spin_unlock(lock) /
                do {__raw_spin_unlock(&(lock)->raw_lock); __release(lock); } while (0)

1、 如果是单处理器

/****include/linux/spinlock_api_up.h****/

#define _spin_unlock(lock)                __UNLOCK(lock)
        #define __UNLOCK(lock) /
                do { preempt_enable(); __release(lock); (void)(lock); } while (0)

完成前文的获取锁的逆过程

2、如果配置了SMP

# define spin_unlock(lock) /
                do {__raw_spin_unlock(&(lock)->raw_lock); __release(lock); } while (0)

3、__raw_spin_unlock在ARM处理器上的实现

 /******include/asm-arm/spinlock.h***/

static inline void __raw_spin_unlock(raw_spinlock_t *lock)
        {
                smp_mb();
                __asm__ __volatile__(
        "         str %1, [%0]/n" // 向lock->lock里写0,解锁
        #ifdef CONFIG_CPU_32v6K
        "         mcr p15, 0, %1, c7, c10, 4/n" /* DSB */
        "         sev"
        #endif
                :
                : "r" (&lock->lock), "r" (0) //%0取&lock->lock放在任意寄存器,%1:任意寄存器放入0
                : "cc");
        }

__raw_spin_unlock只是简单的给lock->lock里写0。

4、__raw_spin_unlock在X86处理器上的实现

/***include/asm-i386/spinlock.h***/

static inline void __raw_spin_unlock(raw_spinlock_t *lock)
        {
                asm volatile("movb $1,%0" : "+m" (lock->slock) :: "memory");
        }

__raw_spin_unlock 函数仅仅执行一条汇编指令:将lock-> slock 置为 1。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Linuxspinlock是一种自旋机制,用于保护对共享资源的访问,以防止同时访问导致的数据竞争问题。spinlock使用了一种称为自旋的技术,即当一个线程需要获取时,它会一直等待,直到被释放。这种等待是循环的,即线程会不断地检查的状态,直到被释放为止。 spinlock相比于传统的互斥量(mutex)和信号量(semaphore)等机制,具有更高的性能和灵活性。spinlock不需要使用内核调度器,因此不会产生额外的上下文切换开销。此外,spinlock可以用于任何需要保护的临界区代码,而不仅仅是用于进程之间的同步。 使用spinlock时,需要将其初始化为0,以便其他线程可以安全地访问共享资源。当一个线程需要获取时,它可以使用spin_lock函数来spinlock。如果已经被其他线程占用,该线程将进入自旋状态,不断检查的状态。当该线程获取到时,它可以将共享资源置于临界区并执行相关操作。在操作完成后,该线程可以使用spin_unlock函数释放spinlock机制适用于一些简单的同步场景,例如在并发访问共享资源时保护临界区代码。然而,对于一些复杂的同步需求,可能需要使用更高级的同步机制,如读写(rwlock)或条件变量(condition variable)。 总之,spinlock是一种轻量级的自旋机制,适用于简单的同步场景,具有较高的性能和灵活性。它适用于任何需要保护的临界区代码,而不仅仅是用于进程之间的同步。在使用spinlock时,需要注意避免死和过度自旋等问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值