ARM-v7 数据大小端转换实现

斯安

已于 2024-04-12 13:31:40 修改

阅读量1.6k

点赞数 33

分类专栏： ARM V7 文章标签： arm开发

于 2024-03-03 23:48:58 首次发布

本文链接：https://blog.csdn.net/m0_47462420/article/details/136423447

版权

ARM V7 专栏收录该内容

14 篇文章 2 订阅

订阅专栏

1.前言

什么是大小端转换？为什么叫大小端转换？

Jonathan Swift的《格列佛游记》中记载，有两国因为剥鸡蛋的方式不同，即一国要求将熟鸡蛋的较大的一端（大端，big endian）敲碎然后剥壳，另一个国家则强制要求敲碎鸡蛋的小端（little endian）。两国无法达成一致，进而交战多年。

一位名为Danny Cohen的网络协议先驱者，将这两个数据用来描述数据在存储器中的排布方式，进而被广泛使用。例如对于一个四字节数据int data = 0x12345678，将低地址视为敲鸡蛋的地面，则有两种存储分布方式：

图1 大小端字节序示意图

如图1所示，data的高字节为0x12，所以左侧的为大端存储顺序，右侧为小端存储顺序。

CPU的厂家众多，对于数据在存储器中的排布方式，也分为两个派系：

CPU	Endian
Intel X86	Little-Endian
Power-PC/IBM	Big-Endian
ARM	默认Little-Endian, 可配置Big-Endian

大小端模式各有优劣，在小端模式下，指针的强制类型转换不需要调整字节内容，如short * (&data)，取的是data低地址的两字节0x56和0x78，对应的也是data较低的16位；大端模式下，数据的符号位固定为第一个字节的最高bit，容易判断符号位，且和人类阅读方式相同，即先写数据的高位，再写数据的低位。

以上讨论的是字节序大小端，事实上，比特（bit）序也存在大小端模式，规则类似，大端的高bit在低地址，小端相反。在定义C语言结构体时，如果存在位段的定义，则需要使各bit与CPU的大小端一致。例如：

typedef struct
{
    uint32 b2LatValSts:2;               //bit 31~30 
    uint32 b2YawRateValSts:2;           //bit 29~28
    uint32 b3EpbSts:3;                  //bit 27~25
    uint32 b1BrakePressSts:1;           //bit 24
    uint32 b2BrakePedlSts:2;            //bit 23~22
    uint32 b2TurnIndicatorSwtichSts:2;  //bit 21~20
    uint32 b3EpsSts:3;                  //bit 19~17
    uint32 b1SteerWhlAngDir:1;          //bit 16
    uint32 b1SteerWhlAngSpdDir:1;       //bit 15
    uint32 b15Reserved:15;              //bit 0~14
}BIG_ENDIAN_SAMPLE_ST_TYPE;

typedef struct
{
    uint32 b15Reserved:15;              //bit 0~14
    uint32 b1SteerWhlAngSpdDir:1;       //bit 15
    uint32 b1SteerWhlAngDir:1;          //bit 16
    uint32 b3EpsSts:3;                  //bit 19~17
    uint32 b2TurnIndicatorSwtichSts:2;  //bit 21~20
    uint32 b2BrakePedlSts:2;            //bit 23~22
    uint32 b1BrakePressSts:1;           //bit 24
    uint32 b3EpbSts:3;                  //bit 27~25
    uint32 b2YawRateValSts:2;           //bit 29~28
    uint32 b2LatValSts:2;               //bit 31~30 
}LITTLE_ENDIAN_SAMPLE_ST_TYPE;

由于Power-PC在网络领域的统治地位，以及其他可能存在的原因，总之网络字节序完成了江湖大一统，统一使用大端字节序。进而，在应用软件开发时，经常需要对网络数据接口进行大小端转换，这个转换主要时针对字节序。那比特序呢？这个通常不需要应用层来做转换，可以姑且理解为某个底层协议栈帮忙做转换了，只需要在应用软件本地按自身CPU的大小端来定义位段即可。

2.大小端转换

2.1 通用的C语言字节序转换方法

#define M_2BYTES_ENDIAN_CONVERT(src)  ((src) = ((typeof(src))0xFF00 & ((src) << 8)) | ((typeof(src))0x00FF & ((src) >> 8)))
#define M_4BYTES_ENDIAN_CONVERT(src)  ((src) = ((typeof(src))0xFF000000 & ((src) << 24)) | ((typeof(src))0x00FF0000 & ((src) << 8))  |((typeof(src))0x0000FF00 & ((src) >> 8)) | ((typeof(src))0x000000FF & ((src) >> 24)))

这里不多说，具体见上述代码中的两个宏定义。

2.2 CMSIS

Common Microcontroller Software Interface Standard(CMSIS)，是ARM封装的Cortex-M架构微控制器的标准软件接口规范。 显然，这里要说的是ARM针对大小端优化所给出的汇编级指令，但还是通过CMSIS标准接口来使用。

2.2.1 大小端转换的相关ARM指令（Cortex-M）

指令	解释
REV {condition} Rd, Rn	转换word的字节序，一个word为4字节
REV16 {condition} Rd, Rn	转换half word的字节序，half word即为2字节
REVSH {condition} Rd, Rn	转换低half word的字节序，并符号拓展至32位（4字节）
RBIT{condition} Rd, Rn	对一个32位的word（字）进行比特序大小端转换

其中，Rd是目标寄存器（destination register)， Rn是操作数寄存器（the register holding the operand)，conditon是操作条件码。例如：

REV R3, R7   ; Reverse byte order of value in R7 and write it to R3.
REV16 R0, R0 ; Reverse byte order of each 16-bit halfword in R0.
REVSH R0, R5 ; Reverse Signed Halfword of R5 and sing extend to 32 bits and then write to R0
REVHS R3, R7 ; Reverse with Higher or Same condition.
RBIT R7, R8  ; Reverse bit order of value in R8 and write the result to R7

2.2.2 CMSIS接口

例如在cmsis_gcc.h中定义有以下内联函数:

#define __CMSIS_GCC_USE_REG(r) "r" (r)

/**
  \brief   Reverse byte order (32 bit)
  \details Reverses the byte order in unsigned integer value. For example, 0x12345678 becomes 0x78563412.
  \param [in]    value  Value to reverse
  \return               Reversed value
 */
__STATIC_FORCEINLINE uint32_t __REV(uint32_t value)
{
#if (__GNUC__ > 4) || (__GNUC__ == 4 && __GNUC_MINOR__ >= 5)
  return __builtin_bswap32(value);
#else
  uint32_t result;

  __ASM volatile ("rev %0, %1" : __CMSIS_GCC_OUT_REG (result) : __CMSIS_GCC_USE_REG (value) );
  return result;
#endif
}

/**
  \brief   Reverse byte order (16 bit)
  \details Reverses the byte order within each halfword of a word. For example, 0x12345678 becomes 0x34127856.
  \param [in]    value  Value to reverse
  \return               Reversed value
 */
__STATIC_FORCEINLINE uint32_t __REV16(uint32_t value)
{
  uint32_t result;

  __ASM volatile ("rev16 %0, %1" : __CMSIS_GCC_OUT_REG (result) : __CMSIS_GCC_USE_REG (value) );
  return result;
}

/**
  \brief   Reverse byte order (16 bit)
  \details Reverses the byte order in a 16-bit value and returns the signed 16-bit result. For example, 0x0080 becomes 0x8000.
  \param [in]    value  Value to reverse
  \return               Reversed value
 */
__STATIC_FORCEINLINE int16_t __REVSH(int16_t value)
{
#if (__GNUC__ > 4) || (__GNUC__ == 4 && __GNUC_MINOR__ >= 8)
  return (int16_t)__builtin_bswap16(value);
#else
  int16_t result;

  __ASM volatile ("revsh %0, %1" : __CMSIS_GCC_OUT_REG (result) : __CMSIS_GCC_USE_REG (value) );
  return result;
#endif
}

/**
  \brief   Reverse bit order of value
  \details Reverses the bit order of the given value.
  \param [in]    value  Value to reverse
  \return               Reversed value
 */
__STATIC_FORCEINLINE uint32_t __RBIT(uint32_t value)
{
  uint32_t result;

#if ((defined (__ARM_ARCH_7M__      ) && (__ARM_ARCH_7M__      == 1)) || \
     (defined (__ARM_ARCH_7EM__     ) && (__ARM_ARCH_7EM__     == 1)) || \
     (defined (__ARM_ARCH_8M_MAIN__ ) && (__ARM_ARCH_8M_MAIN__ == 1))    )
   __ASM volatile ("rbit %0, %1" : "=r" (result) : "r" (value) );
#else
  uint32_t s = (4U /*sizeof(v)*/ * 8U) - 1U; /* extra shift needed at end */

  result = value;                      /* r will be reversed bits of v; first get LSB of v */
  for (value >>= 1U; value != 0U; value >>= 1U)
  {
    result <<= 1U;
    result |= value & 1U;
    s--;
  }
  result <<= s;                        /* shift when v's highest bits are zero */
#endif
  return result;
}

值得注意的是：

① 该接口中，包含了使用gcc builtin的转换函数和使用ARM-v7汇编指令两种方式，显然后者效率更高；

② int16_t __REVSH(int16_t value)函数中，result的类型是int16_t，即有符号的16位数据类型，运算过程中将拓展后的32位有符号数据截断并返还低16位数据；