//字节序列问题
目标机器:
小端序列(little-endian):低地址中存放的是字数据的低字节,高地址存放的是字数据的高字节
常用的x86,x64都是这种类型的
//同网络字节序列
大端序列(big-endian):字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中
Sun公司的机器Sparc架构
高<-----低
16bit宽的数0x1234,程序中此种情况为: 0x1234
地址:0x4000 0x4001
大端:0x12 0x34
小端:0x34 0x12
32bit宽的数0x12345678在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)为:
内存地址 0x4000 0x4001 0x4002 0x4003
存放内容 0x78 0x56 0x34 0x12
而在Big-endian模式CPU内存中的存放方式则为:
内存地址 0x4000 0x4001 0x4002 0x4003
存放内容 0x12 0x34 0x56 0x78
虽然内存中存储方法不同,但是程序中的写法和表示方法一致,当涉及到二进制的处理的时候需要字节序列转换。
//检查CPU类型
int checkCPU()
{
union w{
int a;
char b;
}c;
c.a = 1;
return(c.b ==1); //True 则从低到高存储,小端
}
网络字节序定义:
收到的第一个字节被当作高位看待,这就要求发送端发送的第一个字节应当是高位。
而在发送端发送数据时,发送的第一个字节是该数字在内存中起始地址对应的字节。
可见多字节数值在发送前,在内存中数值应该以大端法存放。
网络字节序说是大端字节序。
//字节序测试程序
//不同cpu平台上字节序通常也不一样,下面写个简单的C程序,它可以测试不同平台上的字节序。
#include <stdio.h>
#include <netinet/in.h>
int main()
{
int i_num = 0x12345678;
printf("[0]:0x%x\n", *((char *)&i_num + 0));
printf("[1]:0x%x\n", *((char *)&i_num + 1));
printf("[2]:0x%x\n", *((char *)&i_num + 2));
printf("[3]:0x%x\n", *((char *)&i_num + 3));
i_num = htonl(i_num);
printf("[0]:0x%x\n", *((char *)&i_num + 0));
printf("[1]:0x%x\n", *((char *)&i_num + 1));
printf("[2]:0x%x\n", *((char *)&i_num + 2));
printf("[3]:0x%x\n", *((char *)&i_num + 3));
return 0;
}
//在80X86CPU平台上,执行该程序得到如下结果:
[0]:0x78
[1]:0x56
[2]:0x34
[3]:0x12
[0]:0x12
[1]:0x34
[2]:0x56
[3]:0x78
//通过对大小端的存储原理分析可发现,对于 char 型数据,由于其只占一个字节,所以不存在这个问题,
//这也是一般情况下把数据缓冲区定义成 char 类型 的原因之一。对于 IP 地址、端口号等非 char 型数据,
//必须在数据发送到网络上之前将其转换成大端模式,在接收到数据之后再将其转换成符合接收端主机的存储模式。
//Linux 系统为大小端模式的转换提供了 4 个函数,输入 man byteorder 命令可得函数原型:
#include <arpa/inet.h>
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);
//转换函数算法
DWORD ToLittleEndian(DWORD dwBigEndian)
{
BYTE* p = (BYTE*)&dwBigEndian;
return (DWORD)(p[0] << 24) + (DWORD)(p[1] << 16) +
(DWORD)(p[2] << 8) + (DWORD)p[3];
}
目标机器:
小端序列(little-endian):低地址中存放的是字数据的低字节,高地址存放的是字数据的高字节
常用的x86,x64都是这种类型的
//同网络字节序列
大端序列(big-endian):字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中
Sun公司的机器Sparc架构
高<-----低
16bit宽的数0x1234,程序中此种情况为: 0x1234
地址:0x4000 0x4001
大端:0x12 0x34
小端:0x34 0x12
32bit宽的数0x12345678在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)为:
内存地址 0x4000 0x4001 0x4002 0x4003
存放内容 0x78 0x56 0x34 0x12
而在Big-endian模式CPU内存中的存放方式则为:
内存地址 0x4000 0x4001 0x4002 0x4003
存放内容 0x12 0x34 0x56 0x78
虽然内存中存储方法不同,但是程序中的写法和表示方法一致,当涉及到二进制的处理的时候需要字节序列转换。
//检查CPU类型
int checkCPU()
{
union w{
int a;
char b;
}c;
c.a = 1;
return(c.b ==1); //True 则从低到高存储,小端
}
网络字节序定义:
收到的第一个字节被当作高位看待,这就要求发送端发送的第一个字节应当是高位。
而在发送端发送数据时,发送的第一个字节是该数字在内存中起始地址对应的字节。
可见多字节数值在发送前,在内存中数值应该以大端法存放。
网络字节序说是大端字节序。
//字节序测试程序
//不同cpu平台上字节序通常也不一样,下面写个简单的C程序,它可以测试不同平台上的字节序。
#include <stdio.h>
#include <netinet/in.h>
int main()
{
int i_num = 0x12345678;
printf("[0]:0x%x\n", *((char *)&i_num + 0));
printf("[1]:0x%x\n", *((char *)&i_num + 1));
printf("[2]:0x%x\n", *((char *)&i_num + 2));
printf("[3]:0x%x\n", *((char *)&i_num + 3));
i_num = htonl(i_num);
printf("[0]:0x%x\n", *((char *)&i_num + 0));
printf("[1]:0x%x\n", *((char *)&i_num + 1));
printf("[2]:0x%x\n", *((char *)&i_num + 2));
printf("[3]:0x%x\n", *((char *)&i_num + 3));
return 0;
}
//在80X86CPU平台上,执行该程序得到如下结果:
[0]:0x78
[1]:0x56
[2]:0x34
[3]:0x12
[0]:0x12
[1]:0x34
[2]:0x56
[3]:0x78
//通过对大小端的存储原理分析可发现,对于 char 型数据,由于其只占一个字节,所以不存在这个问题,
//这也是一般情况下把数据缓冲区定义成 char 类型 的原因之一。对于 IP 地址、端口号等非 char 型数据,
//必须在数据发送到网络上之前将其转换成大端模式,在接收到数据之后再将其转换成符合接收端主机的存储模式。
//Linux 系统为大小端模式的转换提供了 4 个函数,输入 man byteorder 命令可得函数原型:
#include <arpa/inet.h>
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);
//转换函数算法
DWORD ToLittleEndian(DWORD dwBigEndian)
{
BYTE* p = (BYTE*)&dwBigEndian;
return (DWORD)(p[0] << 24) + (DWORD)(p[1] << 16) +
(DWORD)(p[2] << 8) + (DWORD)p[3];
}