armv7实现原子操作的本质——ldrex和strex指令

最新推荐文章于 2024-03-27 10:02:42 发布

weixin_29379325

最新推荐文章于 2024-03-27 10:02:42 发布

阅读量7k

点赞数 6

一、源由

我们的程序逻辑经常遇到这样的操作序列：

1、读一个位于memory中的变量的值到寄存器中

2、修改该变量的值（也就是修改寄存器中的值）

3、将寄存器中的数值写回memory中的变量值

如果这个操作序列是串行化的操作（在一个thread中串行执行），那么一切OK，然而，世界总是不能如你所愿。在多CPU体系结构中，运行在两个CPU上的两个内核控制路径同时并行执行上面操作序列，有可能发生下面的场景：

CPU1上的操作	CPU2上的操作
读操作
	读操作
修改	修改
写操作
	写操作

多个CPUs和memory chip是通过总线互联的，在任意时刻，只能有一个总线master设备（例如CPU、DMA controller）访问该Slave设备（在这个场景中，slave设备是RAM chip）。因此，来自两个CPU上的读memory操作被串行化执行，分别获得了同样的旧值。完成修改后，两个CPU都想进行写操作，把修改的值写回到memory。但是，硬件arbiter的限制使得CPU的写回必须是串行化的，因此CPU1首先获得了访问权，进行写回动作，随后，CPU2完成写回动作。在这种情况下，CPU1的对memory的修改被CPU2的操作覆盖了，因此执行结果是错误的。

不仅是多CPU，在单CPU上也会由于有多个内核控制路径的交错而导致上面描述的错误。一个具体的例子如下：

系统调用的控制路径	中断handler控制路径
读操作
	读操作
	修改
	写操作
修改
写操作

系统调用的控制路径上，完成读操作后，硬件触发中断，开始执行中断handler。这种场景下，中断handler控制路径的写回的操作被系统调用控制路径上的写回覆盖了，结果也是错误的。

二、对策

对于那些有多个内核控制路径进行read-modify-write的变量，内核提供了一个特殊的类型atomic_t，具体定义如下：

typedef struct {
int counter;
} atomic_t;

从上面的定义来看，atomic_t实际上就是一个int类型的counter，不过定义这样特殊的类型atomic_t是有其思考的：内核定义了若干atomic_xxx的接口API函数，这些函数只会接收atomic_t类型的参数。这样可以确保atomic_xxx的接口函数只会操作atomic_t类型的数据。同样的，如果你定义了atomic_t类型的变量（你期望用atomic_xxx的接口API函数操作它），这些变量也不会被那些普通的、非原子变量操作的API函数接受。

具体的接口API函数整理如下：

接口函数	描述
static inline void atomic_add(int i, atomic_t *v)	给一个原子变量v增加i
static inline int atomic_add_return(int i, atomic_t *v)	同上，只不过将变量v的最新值返回
static inline void atomic_sub(int i, atomic_t *v)	给一个原子变量v减去i
static inline int atomic_sub_return(int i, atomic_t *v)	同上，只不过将变量v的最新值返回
static inline int atomic_cmpxchg(atomic_t *ptr, int old, int new)	比较old和原子变量ptr中的值，如果相等，那么就把new值赋给原子变量。返回旧的原子变量ptr中的值
atomic_read	获取原子变量的值
atomic_set	设定原子变量的值
atomic_inc(v)	原子变量的值加一
atomic_inc_return(v)	同上，只不过将变量v的最新值返回
atomic_dec(v)	原子变量的值减去一
atomic_dec_return(v)	同上，只不过将变量v的最新值返回
atomic_sub_and_test(i, v)	给一个原子变量v减去i，并判断变量v的最新值是否等于0
atomic_add_negative(i,v)	给一个原子变量v增加i，并判断变量v的最新值是否是负数
static inline int atomic_add_unless(atomic_t *v, int a, int u)	只要原子变量v不等于u，那么就执行原子变量v加a的操作。如果v不等于u，返回非0值，否则返回0值

三、ARM中的实现

我们以atomic_add为例，描述linux kernel中原子操作的具体代码实现细节：

#if __LINUX_ARM_ARCH__ >= 6 －－－－－－－－－－－－－－－－－－－－－－（1）
static inline void atomic_add(int i, atomic_t *v)
{
    unsigned long tmp;
    int result;

    prefetchw(&v->counter); －－－－－－－－－－－－－－－－－－－－－－－－－（2）
    __asm__ __volatile__(“@ atomic_add\n” －－－－－－－－－－－－－－－－－－（3）
“1:    ldrex    %0, [%3]\n” －－－－－－－－－－－－－－－－－－－－－－－－－－（4）
“    add    %0, %0, %4\n” －－－－－－－－－－－－－－－－－－－－－－－－－－（5）
“    strex    %1, %0, [%3]\n” －－－－－－－－－－－－－－－－－－－－－－－－－（6）
“    teq    %1, #0\n” －－－－－－－－－－－－－－－－－－－－－－－－－－－－－（7）
“    bne    1b”
    : “=&r” (result), “=&r” (tmp), “+Qo” (v->counter) －－－对应％0，％1，％2
    : “r” (&v->counter), “Ir” (i) －－－－－－－－－－－－－对应％3，％4
    : “cc”);
}

#else

#ifdef CONFIG_SMP

#error SMP not supported on pre-ARMv6 CPUs
#endif

static inline int atomic_add_return(int i, atomic_t *v)
{
unsigned long flags;
int val;

    raw_local_irq_save(flags);
    val = v->counter;
    v->counter = val += i;
    raw_local_irq_restore(flags);

return val;
}

#define atomic_add(i, v) (void) atomic_add_return(i, v)

#endif

（1）ARMv6之前的CPU并不支持SMP，之后的ARM架构都是支持SMP的（例如我们熟悉的ARMv7-A）。因此，对于ARM处理，其原子操作分成了两个阵营，一个是支持SMP的ARMv6之后的CPU，另外一个就是ARMv6之前的，只有单核架构的CPU。对于UP，原子操作就是通过关闭CPU中断来完成的。

（2）这里的代码和preloading cache相关。在strex指令之前将要操作的memory内容加载到cache中可以显著提高性能。

（3）为了完整性，我还是重复一下汇编嵌入c代码的语法：嵌入式汇编的语法格式是：asm(code : output operand list : input operand list : clobber list)。output operand list 和 input operand list是c代码和嵌入式汇编代码的接口，clobber list描述了汇编代码对寄存器的修改情况。为何要有clober list？我们的c代码是gcc来处理的，当遇到嵌入汇编代码的时候，gcc会将这些嵌入式汇编的文本送给gas进行后续处理。这样，gcc需要了解嵌入汇编代码对寄存器的修改情况，否则有可能会造成大麻烦。例如：gcc对c代码进行处理，将某些变量值保存在寄存器中，如果嵌入汇编修改了该寄存器的值，又没有通知gcc的话，那么，gcc会以为寄存器中仍然保存了之前的变量值，因此不会重新加载该变量到寄存器，而是直接使用这个被嵌入式汇编修改的寄存器，这时候，我们唯一能做的就是静静的等待程序的崩溃。还好，在output operand list 和 input operand list中涉及的寄存器都不需要体现在clobber list中（gcc分配了这些寄存器，当然知道嵌入汇编代码会修改其内容），因此，大部分的嵌入式汇编的clobber list都是空的，或者只有一个cc，通知gcc，嵌入式汇编代码更新了condition code register。

大家对着上面的code就可以分开各段内容了。@符号标识该行是注释。

这里的__volatile__主要是用来防止编译器优化的。也就是说，在编译该c代码的时候，如果使用优化选项（-O）进行编译，对于那些没有声明__volatile__的嵌入式汇编，编译器有可能会对嵌入c代码的汇编进行优化，编译的结果可能不是原来你撰写的汇编代码，但是如果你的嵌入式汇编使用__asm__ __volatile__(嵌入式汇编)的语法格式，那么也就是告诉编译器，不要随便动我的嵌入汇编代码哦。

（4）我们先看ldrex和strex这两条汇编指令的使用方法。ldr和str这两条指令大家都是非常的熟悉了，后缀的ex表示Exclusive，是ARMv7提供的为了实现同步的汇编指令。

LDREX <Rt>, [<Rn>]

<Rn>是base register，保存memory的address，LDREX指令从base register中获取memory address，并且将memory的内容加载到<Rt>(destination register)中。这些操作和ldr的操作是一样的，那么如何体现exclusive呢？其实，在执行这条指令的时候，还放出两条“狗”来负责观察特定地址的访问（就是保存在[<Rn>]中的地址了），这两条狗一条叫做local monitor，一条叫做global monitor。

STREX <Rd>, <Rt>, [<Rn>]

和LDREX指令类似，<Rn>是base register，保存memory的address，STREX指令从base register中获取memory address，并且将<Rt> (source register)中的内容加载到该memory中。这里的<Rd>保存了memeory 更新成功或者失败的结果，0表示memory更新成功，1表示失败。STREX指令是否能成功执行是和local monitor和global monitor的状态相关的。对于Non-shareable memory（该memory不是多个CPU之间共享的，只会被一个CPU访问），只需要放出该CPU的local monitor这条狗就OK了，下面的表格可以描述这种情况

thread 1	thread 2	local monitor的状态
		Open Access state
LDREX		Exclusive Access state
	LDREX	Exclusive Access state
	Modify	Exclusive Access state
	STREX	Open Access state
Modify		Open Access state
STREX		在Open Access state的状态下，执行STREX指令会导致该指令执行失败
		保持Open Access state，直到下一个LDREX指令

开始的时候，local monitor处于Open Access state的状态，thread 1执行LDREX 命令后，local monitor的状态迁移到Exclusive Access state（标记本地CPU对xxx地址进行了LDREX的操作），这时候，中断发生了，在中断handler中，又一次执行了LDREX ，这时候，local monitor的状态保持不变，直到STREX指令成功执行，local monitor的状态迁移到Open Access state的状态（清除xxx地址上的LDREX的标记）。返回thread 1的时候，在Open Access state的状态下，执行STREX指令会导致该指令执行失败（没有LDREX的标记，何来STREX），说明有其他的内核控制路径插入了。

对于shareable memory，需要系统中所有的local monitor和global monitor共同工作，完成exclusive access，概念类似，这里就不再赘述了。

大概的原理已经描述完毕，下面回到具体实现面。

“1: ldrex %0, [%3]\n”

其中％3就是input operand list中的”r” (&v->counter)，r是限制符（constraint），用来告诉编译器gcc，你看着办吧，你帮我选择一个通用寄存器保存该操作数吧。％0对应output openrand list中的”=&r” (result)，=表示该操作数是write only的，&表示该操作数是一个earlyclobber operand，具体是什么意思呢？编译器在处理嵌入式汇编的时候，倾向使用尽可能少的寄存器，如果output operand没有&修饰的话，汇编指令中的input和output操作数会使用同样一个寄存器。因此，&确保了％3和％0使用不同的寄存器。

（5）完成步骤（4）后，％0这个output操作数已经被赋值为atomic_t变量的old value，毫无疑问，这里的操作是要给old value加上i。这里％4对应”Ir” (i)，这里“I”这个限制符对应ARM平台，表示这是一个有特定限制的立即数，该数必须是0～255之间的一个整数通过rotation的操作得到的一个32bit的立即数。这是和ARM的data-processing instructions如何解析立即数有关的。每个指令32个bit，其中12个bit被用来表示立即数，其中8个bit是真正的数据，4个bit用来表示如何rotation。更详细的内容请参考ARM ARM文档。

（6）这一步将修改后的new value保存在atomic_t变量中。是否能够正确的操作的状态标记保存在％1操作数中，也就是”=&r” (tmp)。

（7）检查memory update的操作是否正确完成，如果OK，皆大欢喜，如果发生了问题（有其他的内核路径插入），那么需要跳转到lable 1那里，从新进行一次read-modify-write的操作。

原创文章，转发请注明出处。蜗窝科技

http://www.wowotech.net/linux_kenrel/atomic.html

标签: 原子操作 atomic 内核同步

« Linux内核同步机制之（二）：Per-CPU变量 | Linux电源管理(11)_Runtime PM之功能描述»

评论：

sgy1993
2018-02-10 11:42

对以下代码有点疑问?希望您能解疑…..
static inline void atomic_add(int i, atomic_t *v)
{
    unsigned long tmp;
    int result;

    prefetchw(&v->counter); －－－－－－－－－－－－－－－－－－－－－－－－－（2）
    __asm__ __volatile__(“@ atomic_add\n” －－－－－－－－－－－－－－－－－－（3）
”1:    ldrex    %0, [%3]\n” －－－－－－－－－－－－－－－－－－－－－－－－－－（4）
”    add    %0, %0, %4\n” －－－－－－－－－－－－－－－－－－－－－－－－－－（5）
”    strex    %1, %0, [%3]\n” －－－－－－－－－－－－－－－－－－－－－－－－－（6）
”    teq    %1, #0\n” －－－－－－－－－－－－－－－－－－－－－－－－－－－－－（7）
”    bne    1b”
    : “=&r” (result), “=&r” (tmp), “+Qo” (v->counter) －－－对应％0，％1，％2
    : “r” (&v->counter), “Ir” (i) －－－－－－－－－－－－－对应％3，％4
    : “cc”);
}
假如只有一个cpu, a程序想对v->counter加1操作, 执行(4)之后, 发生中断,开始执行b程序, b也要访问这个v->counter(对其进行加1操作),之前a执行了ldrex, 所以b的 strex对couter的操作是能够写进去的…此时又转回去执行a..会一直循环到执行成功,…这样从结果上看不就加 2了吗??

a                          b
ldrex–>设置独占标记
                           ldrex
                           modify–>加1操作
                           strex
modify–>加1操作
strex

hello-world
2018-02-11 09:35

@sgy1993：执行过程如下：
a                          b
ldrex–>设置独占标记
                           ldrex
                           modify–>加1操作
                           strex
modify–>加1操作
strex（error，retry）
ldrex–>设置独占标记
modify–>加1操作
strex（OK）
因此，结果是对的。

sgy1993
2018-02-11 13:16

@hello-world：感谢回复:
a只是想加1.. 但是由于b程序能成功加1, 最终结果变量加了2…这个正常吗?

benson
2018-01-01 23:45

armv8上多核结构上，spinlock上必须每个都核都把mmu初始化后，才能用吗？

michael
2017-03-27 11:33

有些看不懂。
对于原子操作，Linux内核是通过哪种原理或者机制，保证了同步？
博主能否用一些常规语言来描述一下。谢谢了

michael
2017-03-27 11:34

@michael：另外，汇编语言也可以被中断打断的吧？

linuxer
2017-03-28 11:47

@michael：原子操作是和CPU ARCH相关的内容，在linux内核中提供了统一的接口，底层有各自的实现。

michael
2017-03-28 15:07

@linuxer：原子操作过程中，interrupt controller是不会响应中断的吧，包括CPU中断和外设中断?

linuxer
2017-03-29 09:53

@michael：除非你disable了interrupt controller的功能，否则它应该是会响应中断请求的，并通知到CPU，当然cpu是否响应中断是看CPU是否disable了local的中断响应，如果没有，那么cpu当然会响应异步中断事件。
当然，如果原子操作只是一条指令（例如SWP指令），那么中断响应要么在该指令之前发生，要么在该指令之后发生。
如果是exclusive指令来完成原子操作，那么中断是可以插入的。

michael
2017-03-30 13:06

@linuxer：感谢您的及时回复。

您的文档中这样描述：对于UP，原子操作就是通过关闭CPU中断来完成的

对于UP（单核），由于原子操作是不允许打断的，所以需要关闭中断来实现吗？

linuxer
2017-03-31 19:13

@michael：我文章中的原话是：
＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
（1）ARMv6之前的CPU并不支持SMP，之后的ARM架构都是支持SMP的（例如我们熟悉的ARMv7-A）。因此，对于ARM处理，其原子操作分成了两个阵营，一个是支持SMP的ARMv6之后的CPU，另外一个就是ARMv6之前的，只有单核架构的CPU。对于UP，原子操作就是通过关闭CPU中断来完成的。
＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
这里的“对于up”是指的那些只支持UP的的ARMv6之前的ARM处理器，这些ARM处理器没有原子指令支持，read-modify-write类型的操作只能是采用关中断来实现。

michael
2017-04-04 15:18

@linuxer：感谢您的回复。

常说的，原子操作是最小的执行单元，执行过程中不会休眠，也不会中断。

这是不是针对ARMv6之前的ARM处理器的？
因为根据您的描述，从ARMv7开始，原子操作似乎可以被中断打断的。

ron
2017-02-27 11:29

@linuxer: 我有个问题请教一下，arm中atomic_add/atomic_sub 这些操作是通过ldex/stex来实现的，但是atomic_set 只是通过#define atomic_set(v, i) （(（v）->counter) = (i)）来实现，那么atomic_set 不存在竞争的情况吗？

linuxer
2017-02-27 19:17

@ron：atomic_add/atomic_sub 这些操作三个步骤（read-modify-write）：
1. read memory to register
2. add register
3. update the new value to the memory

对于atomic_set，只有上面的步骤3而已，一个str操作就OK了，因此不需要特别处理。

ron
2017-02-28 14:58

@linuxer：@linuxer 多谢。got it.

sgy1993
2018-02-10 11:29

@linuxer：atomic_set(v, i)—-会翻译成两条汇编指令啊!
例如—
atomic_t number = ATOMIC_INIT(1);
atomic_set(&number, 4);
上面这条指令的反汇编是
10: e3a02004 mov r2, #4
14: e5832000 str r2, [r3]
这个怎么保证原子操作呢?加入 r2 = 4之后, 别的程序修改了r2.不就有问题????

hello-world
2018-02-11 09:31

@sgy1993：能保证：
14: e5832000 str r2, [r3]
这条指令是原子的就OK了。

sgy1993
2018-02-11 13:12

@hello-world：我觉的应该是mov r2,4执行完之后,是可能被中断打断的,但是中断处理的时候,会保存寄存器的值在堆栈上,中断处理返回来之后,r2的值会从堆栈上弹出来.这样counter的值仍然是4…(如果把4改成一个全局变量也是一样,理论上都是从内存某处取数据放到寄存器(ldr指令), 然后在str 寄存器的值–>内存)..即便ldr执行完,有中断改变了全局变量的值,但由于值已经被ldr存在寄存器里了..所以结果最终还是正确的…个人觉得原子操作应该是即便中断发生,而不影响最终结果的操作

hjl
2016-07-11 21:41

如何是单核，多线程之间是不是存在一个bug?

hello-world
2016-07-12 08:36

@hjl：我有点看不懂你的问题，能再详细点说说吗？

hjl
2016-07-12 09:36

@hello-world：昨晚的疑问是在单核系统下，两个线程共同访问同个变量，利用原子操作进行自加。当线程1 获得这个变量内存的访问权，这时被线程2抢占，线程2也获取这个内存的访问权，进行多次累加，当线程2再次获得访问权时，这时被线程1抢占，线程1继续之间的自加动作，并且将累加的值写回内存。

上面就是场景，这种情况会导致累加结果回退，请问如何避免这种情况？？？

linuxer
2016-07-12 17:48

@hjl：如果自加操作是原子的，那么不会出现你说的问题啊。

jinxin
2015-12-23 08:52

请教一个问题：
嵌入式汇编代码就不会被打断么？
ldrex    %0, [%3]\n” －－－－－－－－－－－－－－－－－－－－－－－－－－（4）
”    add    %0, %0, %4\n” －－－－－－－－－－－－－－－－－－－－－－－－－－（5）
”    strex    %1, %0, [%3]\n” －－－－－－－－－－－－－－－－－－－－－－－－－（6）
这三句代码的执行不会被打断么？
感谢您的回复

passenger
2015-12-23 13:24

@jinxin：你没有仔细看博主的文章哦，这里并不是通过汇编保证原子操作的，而是通过LDREX/STREX这样的exclusive机制。

descent
2015-10-27 09:16

網頁似乎對 <, > 有問題, 排版有些錯亂。

linuxer
2015-10-27 12:21

@descent：已经修复，多谢提醒！

descent
2015-10-27 09:10

感謝, 解除了我對 ldrex,strex 的疑惑

jefby
2015-08-18 21:21

arm64下gcc 4.9.2，编译汇编中@开始地方出现异常
“`
/tmp/ccd6iavd.s: Assembler messages:
/tmp/ccd6iavd.s:26: Error: junk at end of line, first unrecognized character is `@’
“`
gcc4.9不支持@注释符么？

wowo
2015-08-19 13:45

@jefby：您可以多提供一些日志，怀疑你没有用ARM的编译器，可能误用成x86的了…

jefby
2015-08-19 14:06

@wowo：我是在Arm64机器上编译的，用的local gcc，应该不是这个问题

#/usr/bin/gcc asm-test.c -v
Using built-in specs.
COLLECT_GCC=/usr/bin/gcc
COLLECT_LTO_WRAPPER=/usr/libexec/gcc/aarch64-redhat-linux/4.9.2/lto-wrapper
Target: aarch64-redhat-linux
Configured with: ../configure –prefix=/usr –mandir=/usr/share/man –infodir=/usr/share/info –with-bugurl=http://bugzilla.redhat.com/bugzilla –enable-bootstrap –enable-shared –enable-threads=posix –enable-checking=release –enable-multilib –with-system-zlib –enable-__cxa_atexit –disable-libunwind-exceptions –enable-gnu-unique-object –enable-linker-build-id –with-linker-hash-style=gnu –enable-languages=c,c++,objc,obj-c++,fortran,ada,go,lto –enable-plugin –enable-initfini-array –disable-libgcj –with-isl=/home/build/rpmbuild/BUILD/gcc-4.9.2-20141101/obj-aarch64-redhat-linux/isl-install –with-cloog=/home/build/rpmbuild/BUILD/gcc-4.9.2-20141101/obj-aarch64-redhat-linux/cloog-install –enable-gnu-indirect-function –build=aarch64-redhat-linux
Thread model: posix
gcc version 4.9.2 20141101 (Red Hat 4.9.2-1) (GCC)
COLLECT_GCC_OPTIONS=’-v’ ‘-mlittle-endian’ ‘-mabi=lp64’
/usr/libexec/gcc/aarch64-redhat-linux/4.9.2/cc1 -quiet -v asm-test.c -quiet -dumpbase asm-test.c -mlittle-endian -mabi=lp64 -auxbase asm-test -version -o /tmp/ccHLG3ae.s
GNU C (GCC) version 4.9.2 20141101 (Red Hat 4.9.2-1) (aarch64-redhat-linux)
compiled by GNU C version 4.9.2 20141101 (Red Hat 4.9.2-1), GMP version 6.0.0, MPFR version 3.1.2, MPC version 1.0.2
GGC heuristics: –param ggc-min-expand=100 –param ggc-min-heapsize=131072
ignoring nonexistent directory “/usr/lib/gcc/aarch64-redhat-linux/4.9.2/include-fixed”
ignoring nonexistent directory “/usr/lib/gcc/aarch64-redhat-linux/4.9.2/../../../../aarch64-redhat-linux/include”
#include “…” search starts here:
#include <…> search starts here:
/usr/lib/gcc/aarch64-redhat-linux/4.9.2/include
/usr/local/include
/usr/include
End of search list.
GNU C (GCC) version 4.9.2 20141101 (Red Hat 4.9.2-1) (aarch64-redhat-linux)
compiled by GNU C version 4.9.2 20141101 (Red Hat 4.9.2-1), GMP version 6.0.0, MPFR version 3.1.2, MPC version 1.0.2
GGC heuristics: –param ggc-min-expand=100 –param ggc-min-heapsize=131072
Compiler executable checksum: a6fe4020046dbad896213dcd0a3034ff
COLLECT_GCC_OPTIONS=’-v’ ‘-mlittle-endian’ ‘-mabi=lp64’
as -v -EL -mabi=lp64 -o /tmp/ccYexbch.o /tmp/ccHLG3ae.s
GNU assembler version 2.24 (aarch64-redhat-linux) using BFD version version 2.24
/tmp/ccHLG3ae.s: Assembler messages:
/tmp/ccHLG3ae.s:26: Error: junk at end of line, first unrecognized character is `@’

jefby
2015-08-19 14:08

@wowo：asm-test.c代码如下

#include <stdio.h>

int main()
{
    int res = 0, input = 1;
    __asm__ __volatile__(“@ print res=input\n”
        ” mov %1,%0”
        :”=&r”(res)
        :”r”(input)
        :”cc”
            );

    printf(“%d”,res);
}

wowo
2015-08-19 14:33

@jefby：你的宿主机器是ARM64？编译器是GCC？test代码是ARM汇编？我觉得还是有些奇怪啊，gcc编译ARM汇编是有问题吧，要用arm-gcc才行吧？

jefby
2015-08-19 16:07

@wowo：我是在arm64上编译arm64的汇编，用的是arm64机器的local gcc编译器，你可以理解为x86编译x86的汇编，理论上应该是没有问题的。去除掉@符号开始的部分可以编译运行

wowo
2015-08-19 18:54

@jefby：明白您的意思了，我使用“arm-2012.03”或者“arm-2011.09”编译okay，但是使用“gcc-linaro-4.9-2014.11-x86_64_aarch64-linux-gnu”或者“gcc-linaro-aarch64-linux-gnu-4.8-2013.12_linux”编译都失败，可能是GCC的版本问题，但根源是什么，估计要去GNU官网上去问问。

electrlife
2015-08-12 07:02

一直一来，有一个和原语操作类似概念（临界段）代码不解，
task1:
1   add_waitqueue();
2   set_current_state(TASH_UNINTERRUPTIBLE);
3   schedule();

上面的代码是大多同步机制使用的，让线程进入阻塞的一种方式，个人的理解，对于1,2,3的所有操作应该是一个
临界段，但是内核中所的代码都是这样操作。比如如果在２和３的操作中发生抢占，而获得运行的线程，正好release 相关的资源，并把task1从相应的waitqueue中移除，而当task１再次运行时，接着进行schedule，让自己让出cpu，　但此时的task１则丢失了此次的信号。不知道自己应该从哪方面去理解类似的这种场景，希望解惑！

linuxer
2015-08-12 11:26

@electrlife：我觉得内核中的semaphore和你说的场景是类似的，我们一起来看看它的代码（示意代码，我做了修改）：
void down(struct semaphore *sem)
{
    raw_spin_lock_irqsave(&sem->lock, flags);－－－－加锁

    list_add_tail(&waiter.list, &sem->wait_list);－－挂入等待队列

    for (;;) {

        __set_task_state(task, state);－－－－－设定任务状态

        raw_spin_unlock_irq(&sem->lock);－－－－解锁

        timeout = schedule_timeout(timeout);－－－－－调度

        raw_spin_lock_irq(&sem->lock);－－－－－－上锁

    }

    raw_spin_unlock_irqrestore(&sem->lock, flags);－－－－解锁
}

从上面的代码可以看出来，1和2是临界区，被spin lock保护的。

1 2

取消回复

发表评论：

昵称

邮件地址 (选填)

个人主页 (选填)