边界不对齐情况下的ARM CPU访问异常分析

本文探讨了在边界不对齐情况下,ARM CPU如何处理long和short型指针的访问。通过实例展示了编译器对short指针的特殊处理以确保正确性,而long指针则不进行额外处理。通过反汇编代码分析了访问异常的原因,指出当CP15寄存器特定位为0时,ldr指令会结合内存地址和位移进行特定计算,解释了观测到的0x30201040地址结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

自行编写了一个程序,定义一个char型数组如下:
char p[] = {0x10, 0x20, 0x30, 0x40, 0x50, 0x60, 0x70, 0x80};

分别用long型和short型指针去指向p+3的位置,这个地址在编译后是0x10963,明显是一个对long和short来说都不对齐的地址。
程序输出结果如下,括号里为内容,前面是地址。
/mnt $ ./test
l 0x10963(0x30201040), s 0x10963(0x5040), lt 0x30201040, st 0x5040

使用arm-linux-objdump工具反汇编可执行文件发现,对于short指针的引用,编译器做了特殊处理以保证其引用的正确性,而long指针没有做。

unsigned long *l = (p + 3);
    83e0: e59f3084  ldr r3, [pc, #132] ; 846c <.text+0x190>
    83e4: e50b3010  str r3, [fp, #-16]
unsigned short *s = (p + 3);
    83e8: e59f307c  ldr r3, [pc, #124] ; 846c <.text+0x190>
    83ec: e50b3014  str r3, [fp, #-20]
unsigned long lt = *l;
    83f0: e51b3010  ldr r3, [fp, #-16] //变量l->r3
    83f4: e5933000  ldr r3, [r3] //l内容->r3
    83f8: e50b3018  str r3, [fp, #-24] //r3->lt
unsigned short st = *s;
    83fc: e51b3014  ldr r3, [fp, #-20]  //变量s->r3
    8400: e5d32000  ldrb r2, [r3] //s内容(低位)->r2
    8404: e5d33001  ldrb r3, [r3, #1] //s内容(高位)->r3
    8408: e1823403  orr r3, r2, r3, lsl #8 //r3左移后与r2拼合成short值->r3
    840c: e54b301a  strb r3, [fp, #-26] //r3中的short值(低位)->变量st低位
    8410: e1a03443  mov r3, r3, asr #8 //r3右移8位->r3
    8414: e54b3019  strb r3, [fp, #-25] //r3中的short值(高位)->变量st高位

0x30201040是怎么来的?想了半天也不明白。
查 阅ARM相关书籍发现,如果协处理器CP15:c1:c0中的1位和22位均为0,则ARM指令ldr的返回值是memory(addr &  ~3, 4) ROR ((addr & 3) * 8)。前半句的含义是对4边界向下取整,在本例中就是0x10960,再取其内容就是 0x40302010,后半句在本例中是循环右移24位。合起来看就是0x40302010 ROR 24 = 0x30201040,与本例正好吻合! 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值