bitmap bitset roaringbitmap 三者的联系以及原理简单使用

  • bitmap : Bit-map的基本思想就是用一个bit位来标记某个元素对应的Value,而Key即是该元素。由于采用了Bit为单位来存储数据,可以很大力度的节省空间,常用于对大量整数做去重和查询操作。
  • bitset : BitSet就是实现了Bit-Map算法。BitSet位于java.util包下,从JDK1.0开始就已经有了。该类实现了一个按需增长的位向量。位集的每一个组件都有一个boolean类型的值。
    BitSet的每一位代表着一个非负整数。可以检查、设置、清除单个位。一个BitSet可以通过逻辑与、逻辑或、逻辑异或去修改另一个BitSet。默认情况下,所有位的标识都是false。
    可以看到JDK中的BitSet采用Bit-Map思想,BitSet封装较多的API,可供开发者们随意使用。
  • roaringbitmap : Roaring bitmap将32位无符号整数按照高16位分容器,即最多可能有216=65536个容器(container),存储数据时,按照数据的高16位找到container(找不到就会新建一个),
    再将低16位放入container中。高16位又称为共享有效位,它用于索引应该到哪个容器中查找对应的数值,属于roaring bitmap的一级索引。
    Roaring bitmaps以紧凑高效的两级索引数据结构存储32位整数。高密度块使用位图存储;稀疏块使用16位整数的压缩数组。当一个块包含不超过4096个整数时,我们使用一个排好序的16位整数数组。
    当有超过4096个整数时,我们使用2^16 位的位图。为什么按4096作为阀值呢?仅仅是因为当数据块中的整数数量超过这个值之后,bitmap将比数组的内存使用率更高。
    一文读懂比BitMap有更好性能的Roaring Bitmap : https://cloud.tencent.com/developer/article/1753528
    数据开发_Java中IO序列化以及RoaringBitmap序列化 : https://www.cnblogs.com/ytwang/p/13999654.html
import org.roaringbitmap.RoaringBitmap;

import java.io.*;
import java.util.ArrayList;
import java.util.BitSet;
import java.util.Iterator;
import java.util.List;

/**
 * @author: T-WHONG
 * @create: 2021-10-25 16:39:44
 * @description 测试
 **/
public class BitmapDemo {

    private static final int N = 10000000;
    private int[] a = new int[N / 32 + 1];


    public static void main(String[] args) {

        System.out.println ("bitmap 测试-------------------------------");
        int num[] = {1, 5, 30, 32, 64, 56, 159, 120, 21, 17, 35, 45};
//        int num[] = {4, 7};
        BitmapDemo map = new BitmapDemo ();
        for (int i = 0; i < num.length; i++) {
            map.addValue (num[i]);
        }

        int temp = 4;
        if (map.exits (temp)) {
            System.out.println ("value:[" + temp + "] has already exists");
        }
        map.display (3);


        System.out.println ("bitset 测试-------------------------------");
        BitSet bitSet = new BitSet ();
        System.out.println (bitSet.get (10) + "\t" + bitSet.size ());
        bitSet.set (10);
        System.out.println (bitSet.get (10) + "\t" + bitSet.size ());

        System.out.println (bitSet.get (64) + "\t" + bitSet.size ());
        bitSet.set (64);
        System.out.println (bitSet.get (64) + "\t" + bitSet.size ());

        System.out.println ("roaringbitmap 测试-------------------------------");
        test1 ();

    }


    //设置所在的 bit 为 1
    public void addValue(int n) {
        //row = n / 32 求十进制数在数组a中的下标
        int row = n >> 5;
        //相当于 n % 32 求十进制数在数组a[i]中的下标
        a[row] |= 1 << (n & 0x1f);
    }

    // 判断所在的bit为是否为0
    public boolean exits(int n) {
        int row = n >> 5;
        return (a[row] & (1 << (n & 0x1F))) != 0;
    }

    public void display(int row) {
        System.out.println ("BitMap位图展示");
        //a[0] 二进制 bitmap : 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0  & 1
        for (int i = 0; i < row; i++) {
            List<Integer> list = new ArrayList<Integer> ();
            int temp = a[i];
            for (int j = 0; j < 32; j++) {
                list.add (temp & 1);
                temp >>= 1;
            }
            System.out.println ("a[" + i + "]" + list);
        }
    }


    /**
     * RoaringBitmap 测试
     */
    public static void test1() {
        RoaringBitmap r1 = RoaringBitmap.bitmapOf (1, 2, 3, 1000);
        //返回第三个元素
//        System.out.println (r1.select (3));
//        System.out.println (r1.rank (1000));
        r1.add (5);

//        System.out.println (r1.rank (1000));
//        System.out.println (r1.rank (1));
//
//        System.out.println (r1.contains (3));

        RoaringBitmap r2 = new RoaringBitmap ();
        // 向r2添加10000-10009 九个数字
        r2.add (10000, 10009);

        //将 一二 合并为 三
        RoaringBitmap r3 = RoaringBitmap.or (r1, r2);

        //将二追加到一中
        r1.or (r2);
        System.out.println ("r1 大小: " + r1.getCardinality ());
        Iterator<Integer> iterator = r1.iterator ();
        while (iterator.hasNext ()) {
            System.out.println (iterator.next ());
        }


        //将RoaringBitmap 对象序列化存储到本地文件中去
        try {
            //file对应相应的.txt文件
            File file = new File ("");
            FileOutputStream fileOutputStream = new FileOutputStream (file);
            ObjectOutputStream objectOutputStream = new ObjectOutputStream (fileOutputStream);

            r1.serialize (objectOutputStream);

            objectOutputStream.flush ();
            objectOutputStream.close ();
            System.out.println ("序列化到文件完成");

        } catch (FileNotFoundException e) {
            e.printStackTrace ();
        } catch (IOException e) {
            e.printStackTrace ();
        }

        //将RoaringBitmap 对象从本地文件中反序列化,
        RoaringBitmap outRR = new RoaringBitmap ();
        try {

            FileInputStream fileInputStream = new FileInputStream ("");
            ObjectInputStream objectInputStream = new ObjectInputStream (fileInputStream);

            outRR.deserialize (new DataInputStream (objectInputStream));
            System.out.println ("反序列化到文件完成");
            System.out.println ("反序列化后的 outRR 大小: " + outRR.getCardinality ());

            // 遍历输出
            Iterator<Integer> iterator1 = outRR.iterator ();
            while (iterator1.hasNext ()) {
                System.out.println (iterator1.next ());
            }

        } catch (FileNotFoundException e) {
            e.printStackTrace ();
        } catch (IOException e) {
            e.printStackTrace ();
        }


    }
}

  • 部分运行结果如下参考:
    在这里插入图片描述
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值