C/C++结构体的一个高级特性指定成员的位数

最新推荐文章于 2023-12-10 10:15:00 发布

拔剑_浆糊的传说

最新推荐文章于 2023-12-10 10:15:00 发布

阅读量434

点赞数 1

文章标签： c语言 c++ 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40287292/article/details/126101631

版权

-- forward from internet ----------
在大多数情况下，我们一般这样定义结构体：

struct student

{

unsigned int sex;

unsigned int age;

};

对于一般的应用，这已经能很充分地实现数据了的 “ 封装 ” 。

但是，在实际工程中，往往碰到这样的情况：那就是要用一个基本类型变量中的不同的位表示不同的含义。譬如一个 cpu 内部的标志寄存器，假设为 16 bit ，而每个 bit 都可以表达不同的含义，有的表示结果是否为 0 ，有的表示是否越界等等。这个时候我们用什么数据结构来表达这个寄存器呢？

答案还是结构体！

为达到此目的，我们要用到结构体的高级特性，那就是在基本成员变量的后面添加“ : 数据位数”组成新的结构体：

struct xxx

{

成员 1 类型成员 1 : 成员 1 位数 ;

成员 2 类型成员 2 : 成员 2 位数 ;

成员 3 类型成员 3 : 成员 3 位数 ;

};

基本的成员变量就会被拆分！这个语法在初级编程中很少用到，但是在高级程序设计中不断地被用到！例如：

struct student

{

unsigned int sex : 1;

unsigned int age : 15;

};

上述结构体中的两个成员 sex 和 age 加起来只占用了一个 unsigned int 的空间（假设 unsigned int 为 16 位）。

基本成员变量被拆分后，访问的方法仍然和访问没有拆分的情况是一样的，例如：

struct student sweek;

sweek.sex = MALE;// 这里的 MALE 只能是 0 或 1 ，值不能大于 1

sweek.age = 20;

虽然拆分基本成员变量在语法上是得到支持的，但是并不等于我们想怎么分就怎么分，例如下面的拆分显然是不合理的：

struct student

{

unsigned int sex : 1;

unsigned int age : 12;

};

这是因为 1+12 = 13 ，不能再组合成一个基本成员，不能组合成 char 、 int 或任何类型，这显然是不能 “ 自圆其说 ” 的。

在拆分基本成员变量的情况下，我们要特别注意数据的存放顺序，这还与 CPU 是 Big endian 还是 Little endian 来决定。 Little endian 和 Big endian 是 CPU 存放数据的两种不同顺序。对于整型、长整型等数据类型， Big endian 认为第一个字节是最高位字节（按照从低地址到高地址的顺序存放数据的高位字节到低位字节）；而 Little endian 则相反，它认为第一个字节是最低位字节（按照从低地址到高地址的顺序存放数据的低位字节到高位字节）。

我们定义 IP 包头结构体为：

struct iphdr {

#if defined(__LITTLE_ENDIAN_BITFIELD)

__u8 ihl:4,

version:4;

#elif defined (__BIG_ENDIAN_BITFIELD)

__u8 version:4,

ihl:4;

#else

#error "Please fix "

#endif

__u8 tos;

__u16 tot_len;

__u16 id;

__u16 frag_off;

__u8 ttl;

__u8 protocol;

__u16 check;

__u32 saddr;

__u32 daddr;

};

在 Little endian 模式下， iphdr 中定义：

__u8 ihl:4,

version:4;

其存放方式为：

第 1 字节低 4 位 ihl

第 1 字节高 4 位 version （ IP 的版本号）

若在 Big endian 模式下还这样定义，则存放方式为：

第 1 字节低 4 位 version （ IP 的版本号）

第 1 字节高 4 位 ihl

这与实际的 IP 协议是不匹配的，所以在 Linux 内核源代码中， IP 包头结构体的定义利用了宏：

#if defined(__LITTLE_ENDIAN_BITFIELD)

…

#elif defined (__BIG_ENDIAN_BITFIELD)

…

#endif

来区分两种不同的情况。

由此我们总结全文的主要观点：

（ 1 ） C/C++ 语言的结构体支持对其中的基本成员变量按位拆分；

（ 2 ）拆分的位数应该是合乎逻辑的，应仍然可以组合为基本成员变量；

要特别注意拆分后的数据的存放顺序，这一点要结合具体的 CPU 的结构。

-----------------------------------------------------------------------------------------------------

使用位域的主要目的是压缩存储，其大致规则为：

1) 如果相邻位域字段的类型相同，且其位宽之和小于类型的sizeof大小，则后面的字段将紧邻前一个字段存储，直到不能容纳为止；

2) 如果相邻位域字段的类型相同，但其位宽之和大于类型的sizeof大小，则后面的字段将从新的存储单元开始，其偏移量为其类型大小的整数倍；

3) 如果相邻的位域字段的类型不同，则各编译器的具体实现有差异，VC6采取不压缩方式，Dev-C++采取压缩方式；

4) 如果位域字段之间穿插着非位域字段，则不进行压缩；

5) 整个结构体的总大小为最宽基本类型成员大小的整数倍。

============================================================

// Example program

# include < iostream >

# include < string >

using namespace std;

using byte = unsigned char;

typedef struct {

bool o: 2;

byte op : 6;

bool type : 1;

bool is_arg : 1;

short ga: 5;

} bytecode_var_t;

int main()

{

cout<<sizeof(bytecode_var_t)<<endl;

bytecode_var_t b;

b.o = 1;

b.op = 0;

b.is_arg = 1;

b.ga = 11;

cout<<sizeof(bool)<<endl;

cout<<" ====== "<<endl;

cout<<(int)b.o<<" "<<(int)b.op<<" "<<(int)b.is_arg<<" "<<b.ga<<std::endl;

}

拔剑_浆糊的传说

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
C/C++结构体的一个高级特性指定成员的位数

-- forward from internet ----------在大多数情况下，我们一般这样定义结构体：struct student{ unsigned int sex;unsigned int age;};对于一般的应用，这已经能很充分地实现数据了的“封装”。...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。