1. 截断二元码
截断二元码(Truncated binary encoding)是一种适用于拥有均匀分布特性的符号的熵编码方式。当符号个数不为 2 的整数次方时,比起使用普通固定长度的二元编码,采用截断二进制编码能缩短平均码长。
对于变量val,其反二值化方法分为如下两步:
- 计算val的相关变量(stage,num0,num1以及thd)
stage = Ceil(Log(val)) – 1
num0 = 1 << stage
num1 = 1 << (stage + 1)
thd = (num0 << 1) - val
例如,val=6,则stage=5,num0=32,num1=64,thd = 8
2. 对于0~(thd-1),其二元符号串长度为stage的定长码,对于thd ~ val,其二元符号串长度为(stage+1)的定长码
2. 一元码
一元码(Unary)的编码规则是,对于待编码的符号“x”>=0,编码为x个“1”再加一个“0”编码组成。
举个例子:
N=5,根据一元码编码后,编码为“111110”
3.截断一元码
截断一元码(TU,Truncated Unary)属于一元码的变体,用在已知待编码的语法元素的最大值Max的情况下。假设待编码符号为x:
如果0 < x < Max,x二值化采用一元码的方式;
如果x = Max,x二值化的二进制串全部由1组成,长度为Max。
举个例子:
设一个序列中的Max = 6,则对符号“6”进行编码,结果为“111111”,对符号“3”进行编码,按一元码的编码方式,结果为“1110”。