arm 下C编程的非对齐访问

最新推荐文章于 2023-04-23 11:48:50 发布

麦兜兜

最新推荐文章于 2023-04-23 11:48:50 发布

阅读量2.7k

点赞数 2

分类专栏：嵌入式 linux arm 编程文章标签：编程 c struct x86 编译器测试

本文链接：https://blog.csdn.net/lvhongya/article/details/6619908

版权

linux 同时被 3 个专栏收录

8 篇文章 0 订阅

订阅专栏

编程

3 篇文章 0 订阅

订阅专栏

嵌入式

2 篇文章 0 订阅

订阅专栏

看到这个标题，你以为我要讲的是程序中结构体的字节对齐问题，那你就错了，我要讲的是arm下的对于非对齐数据的访问。这个问题把我折腾了一天啊！

闲话少说了，先贴一个测试的代码，如果有arm开发板的同学可以拿到板子上跑一下，和在x86机器上跑出来的程序结果对比一下。

测试代码

 #include <stdio.h>
 #include <stdlib.h>


struct test
{
     unsigned char  a;
     unsigned char  b;
     unsigned char  sc;
     unsigned char  sd;
};
struct test bbb;
int main (int argc, char ** argv)
{
     char *tmp=(char *)&bbb;
     printf("sizeof(struct test)=%d \n",sizeof(struct test));

     bbb.a = 0x01;
     bbb.b = 0x02;
     bbb.sc = 0x03;
     bbb.sd = 0x04;

	 
     printf("bbb   0x%08x \n",*(unsigned long *)tmp);

     printf("tmp   %x= 0x%04x \n",(int)tmp,*((unsigned short *)(tmp)));
     tmp+=1;
     printf("tmp+1 %x= 0x%04x \n",(int)tmp,*((unsigned short *)(tmp))); 
     tmp+=1;
     printf("tmp+2 %x= 0x%04x \n",(int)tmp,*((unsigned short *)(tmp)));  
}

结果出乎意料（如果你不知道），竟然结果不同。

问题分析：

我们假设变量bbb在内存中是这样分布的

0x1000	0x01
0x1001	0x02
0x1002	0x03
0x1003	0x04

1、tmp开始的时候是指向0x1000的，取将tmp强制转换为unsigned short 后输出地值为0x0201，这个没问题。

2、将tmp向后移动一位到0x1001后，取将tmp强制转换为unsigned short 后输出地值，这里，在x86和arm上跑的时候，就出现了不同的值了

在x86机器上跑出来的值是0x0302，这个是我们所期望的；但是在arm上这个值是0x0201。回去了？！

与其他RISC架构一样，ARM处理器能够高效地访问对齐的数据，即字地址的末尾两位为零，半字地址的最后一位为零，也称这样的数据位于它的自然大小边界或者是自然对齐的。ARM编译器希望普通的“C”指针指向一个4字节对齐内存地址，这样它可以在代码中使用LDR/STR指令一次操作4个字节，否则只能使用LDRB/LDRH等字节/半字操作指令。相反如果指针指向一个非自然对齐的地址，例如如果一个整型指针指向地址0x8006，当然希望装载地址0x8006-0x8007-0x8008-0x8009处的数据，但是实际上ARM会对非自然对齐的地址进行转换而从装载地址 0x8004-0x8005-0x8006-0x8007处的数据。

3、如果是long型的强制转换，

long *tmp_long=(long *)tmp;

如果现在tmp指向的是0x1002，*tmp_long会是什么值呢？在x86下可能会出现段错误，因为内存越界了，如果没有的话，输出应该是0x00000403；

在arm下输出的结果是0x02010304，这个我没太想明白。我看网上有的说是循环移位的结果，这个循环移位以字节。如果是这个样子的话，那么short类型为什么不是循环移位啊？想不明白啊。

总结：

对于arm中的双字节或者4字节数据的访问，不能直接通过数据类型的强制转换来实现，必须通过单字节的方式：使用单字节赋值，或者memcpy等函数，不过这样做的时候，首先要先确定数据是大端还是小端模式。

例如上面的数据,需要取出long型，可以这样做

long tmp_long;
memcpy(&tmp_long,tmp,4);

麦兜兜

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
arm 下C编程的非对齐访问

看到这个标题，你以为我要讲的是程序中结构体的字节对齐问题，我要将的是arm下的对于非对齐数据的访问。这个问题把我折腾了一天啊！闲话少说了，先贴一个测试的代码，如果有arm开发板的同学可以拿到板子上跑一下，和在x86机器上跑出来的程序结果对比一下。测试代码 #include
复制链接

扫一扫