int类型的表示范围从0~4294967295,共占用四个字节。而在实际处理中,某些较小的数在除了真正存储的数值以外,其他字节填充值为0,例如7的二进制表示如下,如何将未用上的前三个字节去掉以便节省空间呢?
1.压缩算法
原理
下图①表示整数67335中四个字节实际存储的数据,本压缩算法将每个字节的最高位作为标志位标识整型数值是否结束,未结束置1,结束置0。从低位向高位类推,每个字节都有一位不进行存储,那么四个字节共计有四位需要单独存储。也就是说,本压缩算法能够将4个字节的数值压缩为1~5个字节。
将67335按照七位进行划分,得到②。从右侧向左侧进行填充标志位,67335按照七位划分共存储三个字节,后两个标志位置1,前三个标志位置0,得到③。最后留下实际存储不为0的字节,得到④即压缩后的字节。
再举一个例子:将255压缩
255作为int类型存储如①,将其按照七位划分占用两个字节存储②,将后一个字节标志位置1,将前一个字节标志位置0表示存储结束③,最终结果如④
代码
根据原理说明,需要从后向前按七位进行划分,如果除掉此七位剩余的数值还不为0则说明为存储未结束,将标志位置1,如果数值为0,表示存储结束,标志位置0。
假设传入的值为value
获取后七位的数值c:可以使用c = value & 0x7f
按七位进行一次划分:可以使用右移value>>=7
将标志位置1:c |= 0x80
整理一下
unsigned char buf[100];
int len = 0;
void test_compress(int value) {
do {
unsigned char c = (unsigned char)(value&0x7f); //获取后七位
value >>= 7; //获取余下的值
if (value)
c |= 0x80; //值不为0表示为存储完将标志位置1
buf[len++] = c; //存储这一个字节,实际是7位数据加1个标志位
} while (value); //余下值不为0继续存储
}
注意:由于是按位操作,需要打印函数查看是否正确
- 打印原始数据二进制的
print_ori
函数
此函数每8位加一个空格进行划分
void print_ori(int c) {
for (int i = 31; i >= 0; i--) {
if (i == 7 || i == 15 || i == 23)
cout << " ";
if (0 != (c >> i & 0x1))
cout << "1";
else
cout << "0";
}
printf("