高位和低位的概念

凌晨四点起，海棠花未眠

已于 2024-05-29 19:13:21 修改

阅读量8.7k

点赞数 27

分类专栏：通信协议 Linux操作系统文章标签： linux 网络协议

于 2024-05-29 19:10:43 首次发布

本文链接：https://blog.csdn.net/Lzy1154119938/article/details/139303609

版权

Linux操作系统同时被 2 个专栏收录

10 篇文章

订阅专栏

通信协议

3 篇文章

订阅专栏

1. "高位"和"低位"的概念

在二进制（binary）和十六进制（hexadecimal）的表示中，"高位"和"低位"的概念是相对于数字的左侧和右侧而言的。通常，在数字的书写形式中，最左边的位是高位（Most Significant Bit, MSB），最右边的位是低位（Least Significant Bit, LSB）。

二进制（binary）：
- 例如，数字 1011（在二进制中代表十进制的11）中，1（最左边）是高位，1（最右边）是低位。
十六进制（hexadecimal）：
- 十六进制使用了0-9和A-F来表示数值，每个十六进制位对应4个二进制位（即一个nibble）。
- 例如，在十六进制数 B2（在十六进制中代表十进制的178）中，B（最左边）是高位，2（最右边）是低位。

在二进制和十六进制中，高位的值比低位的值具有更大的权重（或更高的重要性）。这是因为每个位都代表了一个2的幂（在二进制中）或16的幂（在十六进制中），而幂的指数随着位的位置向左移动而增加。因此，高位的变化会导致整个数值的更大变化。

2.小端字节序和大端字节序

小端字节序（Little-Endian）和大端字节序（Big-Endian）是描述多字节数据在内存中存储顺序的两种不同方式。

** 大端字节序（Big-Endian）**：
- 高位字节（Most Significant Byte, MSB）保存在内存的低地址处。
- 低位字节（Least Significant Byte, LSB）保存在内存的高地址处。
- 这种排列方式与人类习惯的数值书写顺序一致，例如十进制数“12345678”中，最高位数字“1”在最左边，最低位数字“8”在最右边。
- 在大端字节序中，多字节数据在内存中的排列顺序与数值的书写顺序相同。
小端字节序（Little-Endian）：
- 高位字节（MSB）保存在内存的高地址处。
- 低位字节（LSB）保存在内存的低地址处。
- 这种排列方式与人类习惯的数值书写顺序相反，但更符合计算机内部处理数据的方式，因为CPU通常从内存的低地址开始读取数据。
- 在小端字节序中，多字节数据在内存中的排列顺序与CPU读取数据的顺序一致。

示例：
假设有一个16位的整数0x1234，其中0x12是高位字节，0x34是低位字节。

在大端字节序中，这个整数在内存中的表示可能是这样的（假设从地址0x00开始）：
- 地址0x00：0x12
- 地址0x01：0x34
在小端字节序中，这个整数在内存中的表示可能是这样的（同样假设从地址0x00开始）：
- 地址0x00：0x34
- 地址0x01：0x12

需要注意的是，不同的硬件平台和数据传输协议可能会使用不同的字节序。例如，x86和x86_64架构的CPU使用小端字节序，而一些网络和通信协议（如网络字节序）则使用大端字节序。因此，在跨平台编程和网络编程中，需要注意字节序的转换问题。

3.可以使用以下C或C++代码段来确定Linux系统的字节序

在Linux系统中，CPU的字节序（是大端还是小端）通常是通过硬件确定的，并且可以通过编程来检测。大多数现代的个人计算机CPU使用小端字节序（Little-Endian），但服务器、嵌入式系统或某些特定的硬件可能使用大端字节序（Big-Endian）。

你可以使用以下C或C++代码段来确定Linux系统的字节序：

#include <stdio.h>

int check_endianness() {
    unsigned int x = 0x12345678;
    char *c = (char *)&x;
    if (*c == 0x78) {
        return 1; // Little-Endian
    } else {
        return 0; // Big-Endian or other (unusual)
    }
}

int main() {
    if (check_endianness()) {
        printf("The system is Little-Endian.\n");
    } else {
        printf("The system is Big-Endian or has an unusual endianness.\n");
    }
    return 0;
}

在这段代码中，我们创建了一个无符号整数x，并给它赋了一个值0x12345678。然后，我们将这个整数的地址强制转换为字符指针c，并检查c所指向的字符值。如果这个字符值是0x78（即x在内存中的最低地址处的字节），那么系统就是小端字节序。否则，它可能是大端字节序或具有不寻常的字节序。

请注意，尽管上述代码在大多数情况下都能正确工作，但它假设char类型是有符号的，并且其大小为一个字节。这些假设在大多数现代系统上都是成立的，但在某些特殊的嵌入式系统或非常规的硬件上可能不成立。如果需要更健壮的代码，你可能需要考虑使用uint8_t类型（来自<stdint.h>）来确保字节大小始终为1，并且使用unsigned char来避免有符号扩展问题。

此外，有些系统提供了预定义的宏来检查字节序，例如__BYTE_ORDER__（在GCC和其他一些编译器中定义）。你可以检查这些宏来确定字节序，而无需编写自己的代码。例如：

#include <endian.h> // 对于某些系统，可能需要包含这个头文件
#if __BYTE_ORDER__ == __ORDER_LITTLE_ENDIAN__
    // Little-Endian
#elif __BYTE_ORDER__ == __ORDER_BIG_ENDIAN__
    // Big-Endian
#else
    // Other or unknown
#endif

 控制台输出如下
/home/linux/HQYJ/Level02_Embedded_applications/day20240517network_protocol/Endianness_of_Linux_systems
The system is Little-Endian.

Process finished with exit code 0

但是，请注意，并非所有的Linux系统都提供了__BYTE_ORDER__宏，因此在使用之前，你应该检查你的系统和编译器是否支持它。

关于0x12345678在小端节序是先读78的解释：在小端字节序（Little-Endian）系统中，多字节数据的最低有效字节（Least Significant Byte, LSB）存储在最低的内存地址上，而最高有效字节（Most Significant Byte, MSB）则存储在较高的内存地址上。

对于32位整数0x12345678，在小端字节序系统中的内存布局会是这样的：

内存地址（从低到高）:   |   78   |   56   |   34   |   12   |

所以当你从这个整数的最低内存地址开始读取时，首先读取到的是0x78，因为它是最低有效字节（LSB）。接着，随着地址的增加，你会依次读取到0x56、0x34和0x12。

在编程和网络通信中，特别是当涉及到跨平台或跨网络的数据传输时，理解并处理字节序是非常重要的。如果发送方和接收方使用了不同的字节序，那么在接收方收到数据后，通常需要将其从网络字节序（大端字节序）转换为主机字节序（可能是小端或大端），或者从主机字节序转换为网络字节序。这可以通过调用如htonl(), ntohl(), htons(), ntohs()等函数（在POSIX兼容的系统中）来实现。