BitMap
传统BitMap
- 传统的bitmap是用一个二进制位(bit)来表示一个值,0表示不存在,1表示存在,这样存储所有32位长度的数据只需要512M存储空间。
- 但是有个问题:这种bitmap比较固定,即使只表示个位数个数字也需要512M的空间,大部分位都是0,比较浪费空间。
Roaring BitMaps
- roaring bitmaps通过将固定的二进制位进行分层,不用位置有不同的应用。从而达到灵活存储,最大限度的高效利用空间的目的。
- 主要思想:将32bit划分为高16bit和低16bit,高16bit确定桶,对应container存储低16bit。
- 实现思想:划分2^16个桶,container类型有三种:
- Array Container
- Bitmap Container
- Run Container