.balignl的意义

原文地址:http://www.groad.net/bbs/read.php?tid-3090.html

U-boot 版本:1.2.0


在 U-boot 的 cpu/arm920t/start.S 里有一处代码为 .balignl 16 0xdeadbeef  ,初一看不知道意欲何为,但从伪指令 .balignl 来看,实际上就是对齐。对于某些处理器来说,所编写的代码不对齐并不会报错,但编译器为了优化,也可能会自动帮你对齐。但对于另外一些处理器的编译器来说,汇编代码里必须手动保持对齐,否则编译器会报错,像上面 ARM 处理器就是如此。

比如我们有一小段汇编代码:
  1. _start:
  2.         b reset
  3.         nop
  4.         .byte 0xff
  5. reset:
  6.         ldr r0, =0x40000000

首先说明一点,在 ARM 中,指令时要求是 32 位对齐的。从上面的代码来看,b reset 这条为 4 个字节,但接下来的 .byte 0xff 定义会让对齐失效。我们用 linux 上的交叉编译器来编译,也能看出来:
[root@centos ARM]# arm-linux-as align.s -o aslign.o
align.s: Assembler messages:
align.s:3: Error: misaligned branch destination

这里的编译器版本是:
[root@centos ARM]# arm-linux-as --version
GNU assembler (GNU Binutils) 2.20

需要注意的是,有些编译器并不会报错(往往版本较为老些),而是它帮你做了优化,帮助你对齐。

这里,为了对齐,我们可以手动修改代码为:
_start:
        b reset
        nop
        .byte 0xff
        .align
reset:
        ldr r0, =0x40000000

这样,编译就不会出错了! 接下来,使用 arm-linux-objdump 来看一下反汇编代码:
[root@centos ARM]# arm-linux-objdump -d aslign.o

aslign.o:     file format elf32-littlearm


Disassembly of section .text:

00000000 <_start>:
   0:   ea000001        b       c 
   4:   e1a00000        nop                     ; (mov r0, r0)
   8:   ff                 .byte   0xff
   9:   00              .byte   0x00
        ...

0000000c :
   c:   e3a00101        mov     r0, #1073741824 ; 0x40000000

从上面可以看到,最后一跳指令所在地址 0xc 是 4 字节对其的。从地址 0x8 开始,依次存放了 .byte 0xff , .byte 0x00, .byte 0x00, .byte 0x00 这 4 个字节,使代码得到了对齐!

在以前的一些帖子里也有讲过(比如《 硬编码 》里),CPU 对待数据和指令代码其实是一样的。基于这个道理,上面依次定义的 4 个字节,凑起来其实也是一条指令,这可以用 arm-linux-objdump 的 -D 参数查看之:
# arm-linux-objdump -D aslign.o

aslign.o:     file format elf32-littlearm


Disassembly of section .text:

00000000 <_start>:
   0:   ea000001        b       c 
   4:   e1a00000        nop                     ; (mov r0, r0)
8:   000000ff        strdeq  r0, [r0], -pc

0000000c :
   c:   e3a00101        mov     r0, #1073741824 ; 0x40000000

在 ARM920T 处理器中,经过分析上面 strdeq 的指令码格式,这条指令并不能用,可以说是条虚指令,详细了解见下图最后的”注释“说明:


.balignl 是个伪指令,完整的格式为:
.balign[wl] abs-expr, abs-expr, abs-expr

第一个参数是一个整数的绝对值,表示后面的指令对齐在它的倍数地址上。
第二个参数也是个绝对值让你指定要填充的指,随便指定,比如 0x55aa 之类的都可以。此参数可选,如果省略,那么默认就用 0 来填充了。
第三个参数也是可选的,表示为了对齐,最大只能跳过多少个字节;但是如果需要跳过更多的字节,那么这里添加的对齐就无效了。

.balignw 和 .balignl 是 .balign 的变体;它们分别表示填充 2 个字节 (word) 及填充 4 个字节 (long word) 。

那么现在我们修改上面的程序,完完整整的将 .balignl 16 0xdeadbeef 放进去:
  1. _start:
  2.         b reset
  3.         nop
  4.         .balignl 16, 0xdeadbeef
  5. reset:
  6.         ldr r0, =0x40000000

查看反汇编:
[root@centos ARM]# arm-linux-objdump -d aslign2.o

aslign2.o:     file format elf32-littlearm


Disassembly of section .text:

00000000 <_start>:
   0:   ea000002        b       10 
   4:   e1a00000        nop                     ; (mov r0, r0)
    8:   deadbeef        cdple   14, 10, cr11, cr13, cr15, {7}
    c:   deadbeef        cdple   14, 10, cr11, cr13, cr15, {7}
00000010 <reset>:
  10:   e3a00101        mov     r0, #1073741824 ; 0x40000000
  14:   e1a00000        nop                     ; (mov r0, r0)
  18:   e1a00000        nop                     ; (mov r0, r0)
  1c:   e1a00000        nop                     ; (mov r0, r0)

由上可见,填充了 8 个字节数据,也就是 2 个 0xdeadbeef 。这样, ld r0, =0x40000000 就对齐到 0x10 地址处,0x10 就是 16。

最后顺便看一下第三个参数的应用情况:
假如将上面的程序  .balignl 16, 0xdeadbeef 改为  .balignl 16, 0xdeadbeef, 4 ,那么反汇编则会看到下面的结果:
[root@centos ARM]# arm-linux-objdump -d aslign2.o

aslign2.o:     file format elf32-littlearm


Disassembly of section .text:

00000000 <_start>:
   0:   ea000000        b       8 
   4:   e1a00000        nop                     ; (mov r0, r0)

00000008 :
   8:   e3a00101        mov     r0, #1073741824 ; 0x40000000
   c:   e1a00000        nop                     ; (mov r0, r0)

因为指定最大才能跳过 4 个字节来对齐,但是这个 16 字节的对齐需要填充 8 个字节,所以伪指令无效。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值