利用布隆处理百万数据

这两天遇到了一个数据处理的问题

是使用Java将三个不定数量(至少百万)的map集合中取得数据的交集

这里可以使用布隆进行数据处理

 

效果是非常好的.,这里用的是整型

所以速度也比较快,如果是字符串的话,可以hash一下

这是布隆工具类

class BloomFilter{

    private static final int BIT_SIZE = 2 << 28 ;//二进制向量的位数,用作数据存储

    private BitSet bits = new BitSet(BIT_SIZE);

    /**
     * 像过滤器中添加字符串
     */
    public void addValue(int value)
    {
        //将数据bit上变为1
        bits.set(value, true);
    }

    /**
     * 判断字符串是否包含在布隆过滤器中
     */
    public boolean contains(int value)
    {

        boolean ret = true;

        //将要比较的数据与布隆过滤器比对
        ret = ret && bits.get(value);
        return ret;
    }

}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值