7-bit整数(Integer)压缩算法

本文介绍了7-bit整数压缩算法,将Int型数据转换为32位表示,并通过示例详细解释了如何压缩一个4字节整数为5字节的过程,包括取位、判断和编码规则。
7-bit 压缩法,针对Integer数据的一种压缩算法,可以将4个字节的Int型数据压缩为1~5个字节,数值越小,压缩后的字节数越少,所以对值小的Int型数据会有比较好的压缩效果,其具体压缩原理,算法如下:
  1. 将一个Int型数据转换成32位; 
  2. 0~6位,按原值写入;
  3. 如果原值的第7位及以后存在1,则转换后的byte的最高位写入1,否则写入0,结束写入(即压缩为了1个字节) ;
  4. 如果没结束,则写入原值的第7~13位,如果原值的第14位及以后存在1,则转换后byte的最高位写入1,否则写入0,结束写入 ;
  5. 重复上述行为,直到写完为止 。

下面的代码就是一个7-bit压缩算法的实现:

private final static int VALUE_MASK = 0x7f;
    private final static int NEXT_BIT_SHIFT = 7;
    private final static int NEXT_BIT_MASK = 1 << 7;

    public static int putCompressedInt(OutputStream out,final int value) throws IOException {
        int i = 0;
        int tmpValue = value;
        do {
            byte b = (byte) (tmpValue & VALUE_MASK);
            tmpValue >>>= NEXT_BIT_SHIFT;
            if (tmpValue != 0) {
                b |= (byte) NEXT_BIT_MASK;
            }
            out.write(b);
            i++;
        } while (tmpValue != 0);
针对这个算法,详细的描述如下,你理解一下,再重新写代码 7-bit 压缩法,针对Integer数据的一种压缩算法,可以将4个字节的Int型数据压缩为1~5个字节,数值越小,压缩后的字节数越少,所以对值小的Int型数据会有比较好的压缩效果,其具体压缩原理,算法如下: 将一个Int型数据转换成32位; 0~6位,按原值写入; 如果原值的第7位及以后存在1,则转换后的byte的最高位写入1,否则写入0,结束写入(即压缩为了1个字节) ; 如果没结束,则写入原值的第7~13位,如果原值的第14位及以后存在1,则转换后byte的最高位写入1,否则写入0,结束写入 ; 重复上述行为,直到写完为止 。 1:在一个字节数据中只保存7bit有效数据,第8位作为一个INT数据是否表示完成的指示位(1表示未完成,0表示已经完成)。 2:通过判断字节的最高BIT位是否为0来获取一个INT型数据,这样我们可以通过1-5个字节数据来表示一个INT型。 3:数据转换通过去除每个字节的指示位,其它bit数据拼接构成INT数据。 一个例子:0x81 存在8个有效的数据位,由于算法中1个字节表示7BIT数据,我们只需要2个字节来表示该数据,转换后的数据表示为:1000 0001 0000 0001,第一个字节最高位为1,第二个字节最高位为0,表明存在2个字节表示该INT型,去除数据指示位,获取到数据000 0001 000 0001,转换为0X81.
最新发布
07-23
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值