1 0~255的整数可以只用一个字节表示,256~65535的数据只需2个字节,65536~16777215需要3个字节,16777216以上4个字节
int uncompressed[] = {...}byte compressed[] = {...}
Encode Integers: int outPos = 0, previous = 0; for (int inPos = 0; inPos < n; inPos++) { int delta = uncompressed[inPos] - previous; while (delta >= 128) { compressed[outPos++] = (delta & 127) | 128; delta = delta >> 7; } compressed[outPos++] = delta; } Decode Integers: int outPos = 0, previous = 0; for (int outPos = 0; outPos < n; outPos++) { for (int shift = 0; ; shift += 7) { int temp = compressed[inPos++]; previous += ((temp & 127) << shift); if (temp < 128) break; } uncompressed[outPos] = previous; }2 行程压缩算法 or( 游程长度压缩算法 ) RLE(Run Length Encoding)
http://blog.csdn.net/orbit/article/details/7062218
这里需要补充的是在传统的RLE算法里,并没有考虑到连续递增或递减的数据序列,例如:2,3,4,5,6,8,9,10,11。2,3,4,5,6是一个增序列,9,10,11,12也是一个增序列,对应这种序列,我们可以添加一个自己的模式来处理它。例如:00b表示连续相同的数字序列, 01b表示连续递增的数字序列,那么可以用(01000101)b表示递增序列的长度为5.
4 NewPForDelta算法
5 variable byte / code 算法
6 LZMA算法,(Lempel-Ziv-Markov chain-Algorithm 的缩写)