整数压缩算法

最新推荐文章于 2021-07-12 11:20:07 发布

gdp5211314

最新推荐文章于 2021-07-12 11:20:07 发布

阅读量5.9k

点赞数

算法专栏收录该内容

11 篇文章 0 订阅

订阅专栏

1 0~255的整数可以只用一个字节表示,256~65535的数据只需2个字节，65536~16777215需要3个字节，16777216以上4个字节

int uncompressed[] = {...}
byte compressed[] = {...}

Encode Integers:
int outPos = 0, previous = 0;
for (int inPos = 0; inPos < n; inPos++) {
int delta = uncompressed[inPos] - previous;
while (delta >= 128) {
compressed[outPos++] = (delta & 127) | 128;
delta = delta >> 7;
}
compressed[outPos++] = delta;
}

Decode Integers:
int outPos = 0, previous = 0;
for (int outPos = 0; outPos < n; outPos++) {
for (int shift = 0; ; shift += 7) {
int temp = compressed[inPos++];
previous += ((temp & 127) << shift);
if (temp < 128) break;
}
uncompressed[outPos] = previous;
}

2 行程压缩算法 or（游程长度压缩算法） RLE（Run Length Encoding）

http://blog.csdn.net/orbit/article/details/7062218

这里需要补充的是在传统的RLE算法里，并没有考虑到连续递增或递减的数据序列，例如：2，3，4，5，6，8，9，10，11。2,3,4,5，6是一个增序列，9，10,11,12也是一个增序列，对应这种序列，我们可以添加一个自己的模式来处理它。例如：00b表示连续相同的数字序列， 01b表示连续递增的数字序列，那么可以用(01000101)b表示递增序列的长度为5.

3 PForDelta索引压缩算法

4 NewPForDelta算法

5 variable byte / code 算法

6 LZMA算法，（Lempel-Ziv-Markov chain-Algorithm 的缩写）

7 DEFLATE压缩算法，是同时使用了LZ77算法与哈夫曼编码（Huffman Coding）的一个无损数据压缩算法

gdp5211314

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
整数压缩算法

1 0~255的整数可以只用一个字节表示,256~65535的数据只需2个字节，65536~16777215需要3个字节，16777216以上4个字节int uncompressed[] = {...}byte compressed[] = {...}Encode Integers:int outPos = 0, previous = 0;for (int in
复制链接

扫一扫