C/C++结构体的一个高级特性指定成员的位数

-- forward from internet ----------
在大多数情况下,我们一般这样定义结构体:
struct student
{
                unsigned int sex;
              unsigned int age;
};
对于一般的应用,这已经能很充分地实现数据了的      封装     
但是,在实际工程中,往往碰到这样的情况:那就是要用一个基本类型变量中的不同的位表示不同的含义。譬如一个   cpu   内部的标志寄存器,假设为   16 bit   ,而每个   bit   都可以表达不同的含义,有的表示结果是否为   0   ,有的表示是否越界等等。这个时候我们用什么数据结构来表达这个寄存器呢?
答案还是结构体!
为达到此目的,我们要用到结构体的高级特性,那就是在基本成员变量的后面添加“     数据位数”组成新的结构体:
struct xxx
{
                成员   1   类型成员   1 :   成员   1   位数   ;
                 成员   2   类型成员   2 :   成员   2   位数   ;
                 成员   3   类型成员   3 :   成员   3   位数   ;
};
基本的成员变量就会被拆分!这个语法在初级编程中很少用到,但是在高级程序设计中不断地被用到!例如:
struct student
{
                unsigned int sex : 1;
              unsigned int age : 15;
};
上述结构体中的两个成员   sex      age   加起来只占用了一个   unsigned int   的空间(假设   unsigned int     16   位)。
基本成员变量被拆分后,访问的方法仍然和访问没有拆分的情况是一样的,例如:
struct student sweek;
sweek.sex = MALE;//   这里的   MALE   只能是   0      1   ,值不能大于   1
sweek.age = 20;
虽然拆分基本成员变量在语法上是得到支持的,但是并不等于我们想怎么分就怎么分,例如下面的拆分显然是不合理的:
struct student
{
                  unsigned int sex : 1;
                unsigned int age : 12;
};
这是因为   1+12 = 13   ,不能再组合成一个基本成员,不能组合成   char      int   或任何类型,这显然是不能      自圆其说      的。
在拆分基本成员变量的情况下,我们要特别注意数据的存放顺序,这还与   CPU      Big endian   还是  Little endian   来决定。   Little endian      Big endian      CPU   存放数据的两种不同顺序。对于整型、长整型等数据类型,   Big endian   认为第一个字节是最高位字节(按照从低地址到高地址的顺序存放数据的高位字节到低位字节);而   Little endian   则相反,它认为第一个字节是最低位字节(按照从低地址到高地址的顺序存放数据的低位字节到高位字节)。
我们定义   IP   包头结构体为:
struct iphdr {
#if defined(__LITTLE_ENDIAN_BITFIELD)
       __u8       ihl:4,
              version:4;
#elif defined (__BIG_ENDIAN_BITFIELD)
       __u8       version:4,
            ihl:4;
#else
#error       "Please fix "
#endif
       __u8       tos;
       __u16       tot_len;
       __u16       id;
       __u16       frag_off;
       __u8       ttl;
       __u8       protocol;
       __u16       check;
       __u32       saddr;
       __u32       daddr;
      
};
   Little endian   模式下,   iphdr   中定义:
       __u8       ihl:4,
              version:4;
其存放方式为:
   1   字节低   4       ihl
   1   字节高   4       version      IP   的版本号)
若在   Big endian   模式下还这样定义,则存放方式为:
   1   字节低   4       version      IP   的版本号)
   1   字节高   4       ihl
这与实际的   IP   协议是不匹配的,所以在   Linux   内核源代码中,   IP   包头结构体的定义利用了宏:
#if defined(__LITTLE_ENDIAN_BITFIELD)
#elif defined (__BIG_ENDIAN_BITFIELD)
#endif
来区分两种不同的情况。
由此我们总结全文的主要观点:
   1               C/C++   语言的结构体支持对其中的基本成员变量按位拆分;
   2               拆分的位数应该是合乎逻辑的,应仍然可以组合为基本成员变量;
要特别注意拆分后的数据的存放顺序,这一点要结合具体的 CPU 的结构。

-----------------------------------------------------------------------------------------------------
使用位域的主要目的是压缩存储,其大致规则为:
1) 如果相邻位域字段的类型相同,且其位宽之和小于类型的sizeof大小,则后面的字段将紧邻前一个字段存储,直到不能容纳为止;
2) 如果相邻位域字段的类型相同,但其位宽之和大于类型的sizeof大小,则后面的字段将从新的存储单元开始,其偏移量为其类型大小的整数倍;
3) 如果相邻的位域字段的类型不同,则各编译器的具体实现有差异,VC6采取不压缩方式,Dev-C++采取压缩方式;
4) 如果位域字段之间穿插着非位域字段,则不进行压缩;
5) 整个结构体的总大小为最宽基本类型成员大小的整数倍。
============================================================
// Example program
# include < iostream >
# include < string >
using namespace std;

using byte = unsigned char;

typedef struct {
  bool o:     2;
byte  op   : 6;
bool type : 1;
bool is_arg : 1;
short ga: 5;
} bytecode_var_t;


int main()
{
    cout<<sizeof(bytecode_var_t)<<endl;
    bytecode_var_t  b;
    b.o = 1;
    b.op = 0;
    b.is_arg = 1;
    b.ga = 11;
    cout<<sizeof(bool)<<endl;
    cout<<" ====== "<<endl;
    cout<<(int)b.o<<"   "<<(int)b.op<<"  "<<(int)b.is_arg<<"  "<<b.ga<<std::endl;
}

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值