问题
大端机和小端机的区别。
深入理解计算机系统里面有如下的描述:
对于跨越多字节的对象,我们必须建立两个原则,这个对象的地址是什么以及存储器中如何排列这些字节。对于第一个问题,几乎在所有的机器上面,多字节对象都被存储为连续的字节序列,因此对象的地址为所使用字节中最小的地址。对于第二个问题,也称为字节序的问题。有两种存储方式。
- 大端模式:数字逻辑高位存储在内存的物理低位
- 小端模式:数字逻辑低位存储在内存的物理低位
当然,为什么要有这个东西呢?
深入理解计算机系统给了如下的描述:
对于本机的程序员来说,他们机器所使用的字节顺序是不可见的。但是,当不同类型的机器之间通过网络传送二进制数据的时候会产生问题。因为不同类型的机器可能会使用不同的字节序,一个常见的问题是当小端机机器产生的数据被发送到大端机时,接受程序字里面的字成了反序的。为了避免这个问题,网络应用程序的代码编写必须遵守已经建立的关于字节序的规则,以确保发送方机器将他的内部表示转换为网络标准。接受方把网络标准转化为接收方的内部表示。
代码实现
主要是对于多字节对象,怎么能访问单个字节的内容。考虑c中的联合体,使用一个单字节对象来访问。
#include <stdio.h>
void check_endian();
int main( void )
{
check_endian();
return 0;
}
void check_endian()
{
union{
char c; // 访问第一个字节
int data;
}un;
un.data = 0x01020304;
if(un.c == 0x01 )
{
printf( "Big endian!\n" );
}
else if( un.c == 0x04 )
{
printf( "Little endian!\n" );
}
else
{
printf("No idea!\n");
}
}
下面的代码展示了主机字节序和网络字节序的区别。intel系列的cpu前者一般都是小端,后者是大端。
#include <stdio.h>
#include <arpa/inet.h>
int main( void ){
unsigned short host_port = 0x1234;
unsigned long host_ip = 0x12345678;
unsigned short net_port = htons( host_port );
unsigned long net_ip = htonl( host_ip );
printf( "Host port : %#x\n", host_port );
printf( "Host ip : %#lx\n", host_ip );
printf( "Net port : %#x\n", net_port );
printf( "Net ip : %#lx\n", net_ip );
return 0;
}
/*
Host port : 0x1234
Host ip : 0x12345678
Net port : 0x3412 // 大端:逻辑高位存物理低位
Net ip : 0x78563412
*/