字节顺序:大端字节(big-endian)和小端字节(little-endian)

原创 2006年06月01日 14:31:00
    今天碰一个关于字节顺序的问题,虽然看起来很简单,但一直都没怎么完全明白这个东西,索性就找了下资料,把它弄清楚.
    因为现行的计算机都是以八位一个字节为存储单位,那么一个16位的整数,也就是C语言中的short,在内存中可能有两种存储顺序big-endian和litte-endian.考虑一个short整数0x3132(0x32是低位,0x31是高位),把它赋值给一个short变量,那么它在内存中的存储可能有如下两种情况:
大端字节(Big-endian):
----------------->>>>>>>>内存地址增大方向
short变量地址
       0x1000                  0x1001
_____________________________
|                           |
|         0x31             |       0x32
|________________ | ________________
高位字节在低位字节的前面,也就是高位在内存地址低的一端.可以这样记住(大端->高位->在前->正常的逻辑顺序)
 
小端字节(little-endian):
----------------->>>>>>>>内存地址增大方向
short变量地址
       0x1000                  0x1001
_____________________________
|                           |

|         0x32             |       0x31

|________________ | ________________

低位字节在高位字节的前面,也就是低位在内存地址低的一端.可以这样记住(小端->低位->在前->与正常逻辑顺序相反)
 
可以做个实验
在windows上如下程序
#include <stdio.h>
#include <assert.h>
 
void main( void )
{
        short test;

        FILE* fp;

        
        test = 0x3132;  //(31ASIIC
码的’1’,32ASIIC码的’2’)
        if ((fp = fopen ("c://test.txt", "wb")) == NULL)
              assert(0);
        fwrite(&test, sizeof(short), 1, fp);
        fclose(fp);
}
    然后在C盘下打开test.txt文件,可以看见内容是21,而test等于0x3132,可以明显的看出来x86的字节顺序是低位在前.如果我们把这段同样的代码放到(big-endian)的机器上执行,那么打出来的文件就是12.这在本机中使用是没有问题的.但当你把这个文件从一个big-endian机器复制到一个little-endian机器上,再直接将数据读到short变量时就出现问题了.
    如上述例子,我们在big-endian的机器上创建了这个test文件,把其复制到little-endian的机器上再用fread读到一个short变量里面,我们得到的就不再是0x3132而是0x3231了,这样读到的数据与我们的本意不相符,是错误的,所以在两个字节顺序不一样的机器上交互数据时需要特别小心字节顺序,理解了字节顺序在可以帮助我们写出移植行更高的代码.
正因为有字节顺序的差别,所以在网络传输的时候定义了所有字节顺序相关的数据都使用big-endian,BSD的代码中定义了四个宏来处理:
#define ntohs(n)     //网络字节顺序到主机字节顺序 n代表net, h代表host, s代表short
#define htons(n)     //主机字节顺序到网络字节顺序 n代表net, h代表host, s代表short
#define ntohl(n)      //网络字节顺序到主机字节顺序 n代表net, h代表host, l代表 long
#define htonl(n)      //主机字节顺序到网络字节顺序 n代表net, h代表host, l代表 long
 
举例说明下这其中一个宏的实现:
 #define sw16(x) /
    ((
short)( /
        (((
short)(x) & (short)0x00ffU) << 8) | /
        (((
short)(x) & (short)0xff00U) >> 8) ))
这里实现的是一个交换两个字节顺序.其他几个宏类似.

我们改写一下上面的程序
#include <stdio.h>
#include <assert.h>
 
#define sw16(x) /
    ((short)( /
        (((short)(x) & (short)0x00ffU) << 8) | /

        (((short)(x) & (short)0xff00U) >> 8) ))

// 因为x86下面是低位在前,需要交换一下变成网络字节顺序
#define htons(x) sw16(x)
 
void main( void )
{
        short test;

        FILE* fp;
        
        test = htons(0x3132); //(31ASIIC
码的’1’,32ASIIC码的’2’)
       
if ((fp = fopen ("c://test.txt", "wb")) == NULL)
              assert(0);
        fwrite(&test, sizeof(short), 1, fp);
        fclose(fp);
}
 
    如果在高字节在前的机器上,由于与网络字节顺序一致,所以我们什么都不干就可以了,只需要把#define htons(x) sw16(x)宏替换为 #define htons(x) (x).
    一开始我在理解这个问题时,总在想为什么其他数据不用交换字节顺序?比如说我们write一块buffer到文件,最后终于想明白了,因为都是以unsigned char类型一个字节一个字节的写进去,这个顺序是固定的,不存在字节顺序的问题,只有对short或者int赋值时存在这个问题,t够笨啊..

大端与小端

前两天看到大端小端时,小端:低字节的值在前,高字节的值在后大端:高字节的值在前,低字节的值在后看到一个c的语言题,不是很清楚: #include int main() {           ...
  • yooongmoon
  • yooongmoon
  • 2011年03月06日 14:20
  • 121

大端字节序和小端字节序

对表示一个对象的字节序列排序,有两个同用的规则。有些机器选择在存储器中按照从最低有效字节到最高有效字节的顺序存储对象,而另一些机器按照从最高有效字节到最低有效字节的顺序存储。前一种规则——最低有效字节...
  • qq_33724710
  • qq_33724710
  • 2016年04月04日 14:50
  • 2142

关于CPU字节存放顺序的说明(大端小端)

      端模式(Endian)的这个词出自Jonathan Swift书写的《格列佛游记》。这本书根据将鸡蛋敲开的方法不同将所有的人分为两类,从圆头开始将鸡蛋敲开的人被归为Big Endian,从...
  • dddd1989102
  • dddd1989102
  • 2010年02月17日 11:05
  • 1907

Java大端字节和小端字节

1、什么是大端和小端 1) Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。2) Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的...
  • hfmbook
  • hfmbook
  • 2017年04月17日 11:29
  • 589

对整数和浮点数存储,little-endian和big-endian字节顺序,以及位运算的一点回顾

对问题的一些理解 1.位运算及其相关运算 位运算 &,|,^,~,>,+,! 用 异或^ 可以交换两个变量,不需要中间变量 a = a ^ b;   // a = 0000 1111 b =...
  • hoppboy
  • hoppboy
  • 2012年03月04日 15:43
  • 2247

大端模式、小端模式和网络字节顺序【转】

这里转载一片文章,通过这篇文章我了解了转换成网络字节顺序的意义,以前在作TCP/IP通信的时候对于htonl()函数不是很理解,现在知道了,原来我们普通的x86体系结构都是小端模式,而网络传输要求的是...
  • shan275
  • shan275
  • 2016年05月07日 14:50
  • 575

字节顺序Little-Endian, Big-Endian

 
  • flyingstarwb
  • flyingstarwb
  • 2008年03月12日 18:34
  • 800

关于大端字节序和小端字节序

现在,大多数的计算机都是按字节编址的(除了按字节编址还有按字编址和按位编址)。所以这里只讨论按字节编址的计算机。 大端字节序:数据的高字节保存在低地址。 小端字节序:数据的高字节保存在高地址。 ...
  • SKY453589103
  • SKY453589103
  • 2016年01月27日 17:30
  • 2659

字节顺序的详细解释--关于Big endian和 Little endian

一、基本概念位的概念:在计算机中,一个0或1称为一位(bit)。字节:连续的八位称为一个字节(Byte),字节是计算机中可单独处理的最小单位。即以字节为基本单位来解释信息,规定1个字节是8个二进制位。...
  • wave_1102
  • wave_1102
  • 2007年10月29日 09:59
  • 2100

大端字节小端字节

Big Endian In big endian, you store the most significant byte in the smallest address. Here's how...
  • u012308776
  • u012308776
  • 2014年09月06日 20:18
  • 287
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:字节顺序:大端字节(big-endian)和小端字节(little-endian)
举报原因:
原因补充:

(最多只允许输入30个字)