Endians是什么意思?它是数据在内存中的排列顺序。在微处理器中,象long/DWORD(32 bits) 0x12345678 这样的数据总是按照高位优先(BIG ENDIAN)方式存放的。但在内存中,数据存放顺序则因微处理器厂商的不同而不同。
数据大小的不同:
Byte:一个字节,标记为byte 0
Word:二个字节,从byte 0到byte 1
Long : 四个字节,从byte 0到byte 3
每个byte由8个位(bit)组成,从bit 7 到 bit 0 (从左往右)。
每个word由16个 bit 组成,从bit 15 到 bit 0 (从左往右)。
每个long由32个 bit 组成,从bit 31 到 bit 0 (从左往右)。
byte 0 是LSB (Less Significant Byte,最低有效字节),byte 3 是MSB (Most Significant Byte,最高有效字节)。因此如果有:
Byte : 3 2 1 0
Number : $12 $34 $56 $78
则值等于:$12*256^3 + $34*256^2 + $56*256^1 + $78*256^0
word类型也一样。word 0 是LSW (Less Significant Word,最低有效字),word 1 是MSW (Most Significant Word,最高有效字):
Word : 1 0
Number : $1234 $5678
值等于:$1234*65536^1 + $5678*65536^0.
字节存放方式:
BIG ENDIAN : 最低地址存放高位字节,可称为高位优先。内存从最低地址开始,顺序存放:
Byte : Byte 3 ($12) (正好是MSB)
Word : Byte 3 到 Byte 2,即word 1 ($1234) (按照从MSB 到 LSB 顺序存放)
Long : Byte 3 到 Byte 0,即word 1 到 word 0 ($12345678) (按照从MSB 到 LSB 顺序存放)
BIG ENDIAN 存放方式正是我们的书写方式,大数先写(比如,总是按照千、百、十、个位来书写数字)。而且所有的处理器都是按照这个顺序存放数据的。
在内存中,根据地址 n (+ 位移量),存放的数据分别是:
n+0 : Byte 3 ($12) (MSB 优先: BIG Endian)
n+1 : Byte 2 ($34)
n+2 : Byte 1 ($56)
n+3 : Byte 0 ($78) (LSB)
Byte 0 的位置是:'n+3' (在 'n+3', byte 0 等于 $78)
Word 0 的位置是:'n+2' ('n+2' 到 'n+3', byte 1 到 byte 0, word 0 等于 $5678)
Long 0 的位置是:'n+0' ('n+0' 到 'n+3', byte 3 到 byte 0, long 0 等于 $12345678)
高位优先方式对于嵌入式系统和调试内存映象都很有用。在寄存器中读到的数据就是内存里的数据。但是如果要在word 0 的地址 'n+2' 处提取低位字(Low Word),就要用附加的内存,通过移位后才能得到,所以会稍慢些。
例如在寄存器中有:$12345678
从地址 'n+0' 开始: $12 $34 $56 $78 (按字节从MSB 到 LSB,即byte 3 到 byte 0)
从地址'n+0' 开始: $1234 $5678 (按字从MSB 到 LSB, 即word 1 到 word 0)
BIG ENDIAN 排列顺序还广泛运用在TCP/IP协议上!主要使用BIG Endian 排列结构的是摩托罗拉的 Motorola 6800 系列,68000 系列和ColdFire 系列。PowerPC 是用低位优先(Little Endian)顺序,它是从IBM Power 处理器系列派生而来的。
LITTLE ENDIAN : 最低地址存放低位字节,可称为低位优先。内存从最低地址开始,顺序存放:
Byte : Byte 0 ($78) (正好是 LSB)
Word : Byte 0 到 Byte 1,即 word 0 ($7856) (按照从LSB 到MSB 顺序存放)
Long : Byte 0 到 Byte 3,即 word 0 到 word 1 ($78563412) (按照从LSB 到MSB 顺序存放)
LITTLE ENDIAN 处理器是通过硬件将内存中的LITTLE ENDIAN 排列顺序转换到寄存器的BIG ENDIAN排列顺序的,没有数据加载/存储的开销,不用担心。
在内存中,根据地址 n (+ 位移量),存放的数据分别是:
n+0 : Byte 0 ($78) (LSB 优先:Little Endian)
n+1 : Byte 1 ($56)
n+2 : Byte 2 ($34)
n+3 : Byte 3 ($12) (MSB)
Byte 0 的位置是:'n+3' (在 'n+3', byte 0 等于 $78)
Word 0 的位置是:'n+2' ('n+2' 到 'n+3', byte 1 到 byte 0, word 0 等于 $5678)
Long 0 的位置是:'n+0' ('n+0' 到 'n+3', byte 3 到 byte 0, long 0 等于 $12345678)
Byte 0 的位置是:'n+0' (在 'n+0', byte 0 等于 $78)
Word 0 的位置是:'n+0' ('n+0' 到 'n+1', byte 0 到to byte 1, word 0 等于 $5678,按照 LITTLE ENDIAN 顺序)
Long 0 的位置是:'n+0' ('n+0' 到 'n+3', byte 0 to byte 3, long 0 等于 $12345678,按照 LITTLE ENDIAN 顺序)
低位优先顺序对于要取得诸如LSB或LSW这样的低位数据是很有用的。只要在起始位置上直接提取即可。不过在内存调试时可有些“古怪”。
例如在寄存器中有:$12345678
从地址 'n+0' 开始:$78 $56 $34 $12 (按字节从LSB 到 MSB)
从地址 'n+0' 开始:$7856 $3412 (按字从LSB to MSB)
注意:少数一些处理器是按照LITTLE ENDIAN 排列顺序来进行位运算的,就是说,一个从bit 31 到bit 0 表达的long类型数值按照从bit 0到bit 31的顺序来存放!
寄存器有: $12345678 (%10010001101000101011001111000)
在地址'n+0':$01CD4589 (%0001110011010100010110001001) (老天,真蠢!)
附件:本文提及的数据格式:
公司: Motorola Toshiba Intel
十进制(Decimal) : 123 123 123 (缺省)
八进制(Octal) : @173 o173 173o
十六进制(Hexa) : $7B h7B 7Bh
二进制(Binary) : %1111011 b1111011 1111011b