位操作的一种方法是按位运算与或非左移右移等,另外一种就是位字段(bit field)。位字段是一个signed int 、unsigned int、bool、char、unsigned char类型变量中的一组相邻的位。位字段通过一个结构体定义来建立,该结构体为每个字段提供标签并确定该字段的宽度。通俗来讲,位段就是把一个字节中的二进位划分为几个不同的区域,并说明每个位段的位数。每个位段都有一个域名,操作这个位段可以操作这个域名(其实就是个长度受限的变量)。
在实际编程中,有时候我们的变量只有0和1两种值,或者值的范围远小于所定义的变量类型,这时采用位字段的方式就可以节省程序运行时的空间大小。除了内存以外,位字段还可以充分利用所有位,例如你可以用一个char型变量的8各位分别来表示8个开关的打开和闭合。例如:
struct button{
unsigned char button1:1;
unsigned char button2:1;
unsigned char button3:1;
unsigned char button4:1;
unsigned char button5:1;
unsigned char button6:1;
unsigned char button7:1;
unsigned char button8:1;
};
如上图 struct button 实际大小为一个字节,比没有采用位字段方式可以节省7个字节。使用时方式和普通结构体的使用方式一致,但是值的范围不能超过你定的位数。且在用内存函数进行拷贝的时候,要很小心内存越界。
位字段可以用在不同的数据类型之间,例如:
typedef struct
{
unsigned int a:2;
unsigned char b:2;
}event;
上述event大小是4个字节,也就是说,变量a和变量b都共用一个unsigned int类型的大小。(如果相邻的位域字段的类型不同,则各编译器的具体实现有差异,VC6采取不压缩方式(不同位域字段存放在不同的位域类型字节中),Dev-C++和GCC都采取压缩方式)
对于位字段,还有如下几个说明:
1、一个位于必须存储在同一个字节中,不能跨越数据类型的自然边界,也就是不能一个位域存储在两个数据类型中。如果一个字节所剩的空间不够存放一个位域时,会从下一个字节单元开始存放该位域。当然,我们也可以强制让某个位字段从下一个字节单元开始。例如:
struct event{
unsigned char a:5;
unsigned char b:6;
unsigned char :0;
unsigned char d:2;
unsigned char :2;
unsigned char e:1;
};
如上结构体,大小为3。内存使用如下,a占用一个字节,b占用一个字节 ,d和e占用一个字节,共3字节。在说明原因之前,我们先说下:位域可以是无名位域,无名位域就是类似于unsigned char :0 或者unsigned char :2,虽然两者只是0和非0的区别,但是作用确是不同的。如果无名位域的位数为0,那么下一个位域将会被强制从下一个数据单元开始,如果无名位域为非0,则意味着这个无名位域占着空间,但是我们却用不了,就是一个黑洞。这样我们就可以很好地理解上述结构体为3的原因了。
需要另外说明下无名位域位数为0,下一个位域将强制从下一个单元开始。这里的下一个单元指的不是下一个字节,而是必须要跨过一次数据类型的自然边界的。例如:
typedef struct
{
unsigned int a:4;
unsigned int :0;
unsigned int b:4;
}event;
上述结构体大小,是8个字节。也就是说变量b要从下一个int类型开始存储。并不是从a的第二个字节开始存储,跨越了一次a的边界。(如果相邻位域字段的类型相同,但其位宽之和大于类型的sizeof大小,则后面的字段将从新的存储单元开始,其偏移量为其类型大小的整数倍)
接下来举个综合例子,这个例子来源是:https://blog.csdn.net/Alex123980/article/details/51959367#commentBox
#include <iostream>
#include <memory.h>
using namespace std;
struct A
{
int a:5;
int b:3;
};
int main(void)
{
char str[100] = "0134324324afsadfsdlfjlsdjfl";
struct A d;
memcpy(&d, str, sizeof(A));
cout << d.a << endl;
cout << d.b << endl;
return 0;
}
上述代码在32位机器上是输出
-16
1
解析:在默认情况下,为了方便对结构体内元素的访问和管理,当结构体内的元素长度都小于处理器的位数的时候,便以结构体里面最长的元素为对其单位,即结构体的长度一定是最长的数据元素的整数倍;如果有结构体内存长度大于处理器位数的元素,那么就以处理器的位数为对齐单元。由于是32位处理器,而且结构体中a和b元素类型均为int(也是4个字节),所以结构体的A占用内存为4个字节。
上例程序中定义了位域结构A,两个个位域为a(占用5位),b(占用3位),所以a和b总共占用了结构A一个字节(低位的一个字节)。
当程序运行到14行时,d内存分配情况:
高位 00110100 00110011 00110001 00110000 低位 '4' '3' '1' '0' 其中d.a和d.b占用d低位一个字节(00110000),d.a : 10000, d.b : 001
d.a内存中二进制表示为10000,由于d.a为有符号的整型变量,输出时要对符号位进行扩展,所以结果为-16(二进制为11111111111111111111111111110000)
d.b内存中二进制表示为001,由于d.b为有符号的整型变量,输出时要对符号位进行扩展,所以结果为1(二进制为00000000000000000000000000000001)