同哈夫曼编码,属于变长编码的一种
二者的区别:
1、信源相关性--哈夫曼编码依赖于信源的概率分布,指数哥伦布编码与信源无关;
2、额外信息--哈夫曼编码的数据必须额外携带与该信源匹配的码表(不同的信息流里面的字符分布情况不一样,针对每个信息流的哈夫曼编码数据必须有对应的码表);指数哥伦布编码无需携带任何信息。
3、指数哥伦布编码的压缩效率通常更低,甚至毫无压缩效果,而在不考虑码表的情况下,哈夫曼编码压缩效率更高。
0阶无符号指数哥伦布编码
ue(v)的 码字分为三部分:[prefix]+1+[surfix] 前缀+1+后缀
前缀部分为连续的n个0,后缀部分表示实际数值的信息位,其长度与前缀一致。
[prefix]和[surfix]的长度由码元取值确定;
[ 0xA6, 0x42, 0x98, 0xE2, 0x04, 0x8A]的二进制表示为:
10100110 01000010 10011000 11100010 00000100 10001010
1 010 011 00100 00101 00110 00111 0001000 0001001 0001010
对应的值如上图所示:0 1 2 3 4 5 6 7 8 9
// ExpColum.cpp : 定义控制台应用程序的入口点。
#include "stdafx.h"
#include <assert.h>
typedef unsigned char UINT8;
//bytePotion、bitPosition分别表示读入的第几个字节的第几位
static int get_bit_at_position(UINT8 *buf, UINT8 &bytePotion, UINT8 &bitPosition)
{
//第一次读入的是0XA6 1010 0110
UINT8 mask = 0, val = 0;
//当bitPosition = 0 时,如果我们想要读取一个字节最左边一位,也就是最高位(11100110),7-0
mask = 1 << (7 - bitPosition); //128 1000 0000 ; 64 0100 0000 ; 32 0010 0000
//通过bytePoint获取字节
val = ((buf[bytePotion] & mask) != 0); //读取位的值 1; 01
if (++bitPosition > 7) { //接着向后读取,需要注意的是在这个位置无论条件语句的内容有没有执行,bitPosition都已经执行了一次++操作
bytePotion++;
bitPosition = 0;
}
return val;
}
//bytePotion、bitPosition分别表示读入的第几个字节的第几位
static int get_uev_code_num(UINT8 *buf, UINT8 &bytePotion, UINT8 &bitPosition)
{
assert(bitPosition < 8); //断言,确保bitPosition的值小于8,程序才会往下进行
UINT8 val = 0, prefixZeroCount = 0; //记录哥伦布指数有多少个前缀0
int prefix = 0, surfix = 0; //定义前缀和后缀的值
while (true)
{
//调用读取每个比特位的函数
val = get_bit_at_position(buf, bytePotion, bitPosition);
if (val == 0)
{
prefixZeroCount++;
}
else
{
break; //读到1的时候跳出循环
}
}
prefix = (1 << prefixZeroCount) - 1; //通过左移得到2^prefixZeroCount - 1 的效果
for (size_t i = 0; i < prefixZeroCount; i++)
{
val = get_bit_at_position(buf, bytePotion, bitPosition);
surfix += val * (1 << (prefixZeroCount - i - 1));
}
prefix += surfix; //前+后
return prefix;
}
int _tmain(int argc, _TCHAR* argv[])
{
//逐比特读取
UINT8 strArray[6] = { 0xA6, 0x42, 0x98, 0xE2, 0x04, 0x8A };
UINT8 bytePosition = 0, bitPosition = 0;
UINT8 dataLengthInBits = sizeof(strArray) * 8; //定义这个数组占用了多少bit
int codeNum = 0;
//判断条件:当前读取的字节数*8+当前读到的比特数,即目前一共读取了多少bit
while ((bytePosition * 8 + bitPosition) < dataLengthInBits)
{
codeNum = get_uev_code_num(strArray, bytePosition, bitPosition);
printf("ExpoColumb codeNum = %d\n", codeNum);
}
return 0;
}