位图法处理大数据-Java

问题

给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?

在2.5亿个整数中找出不重复的整数,注,内存不足以容纳这2.5亿个整数?

算法

可以使用位图法,位图法的主要思想是:一个int类型占4个字节,一个字节8个bit,那么如果用每一个bit代表一个数是否存在的话,那么可以代表4*8=32bit。可以表示0-31范围的数字。bit[32]的空间比int[32]要小的多。

另外一种用法是结合hash函数,这样0-31就不止32个数了。

例如:5,12,26这三个数字,将它用位图法表示的话,那么就是
bit[5]=1;bit[12]=1;bit[26]=1;其他为0;
判断a是否存在,可以看bit[a]是否为1。为1则表示存在。

Java实现

import java.util.BitSet;

public class SomeTest {

	public static void main(String[] args) {
		BitSet bitSet = new BitSet();

		int[] num = new int[] { 5, 12, 26 };

		for (int i = 0; i < num.length; i++) {
			bitSet.set(num[i]);
		}

		int a = 15;

		if (bitSet.get(a)) {
			System.out.println(a + ",重复");
		} else {
			System.out.println(a + ",不重复");
		}

		a = 26;

		if (bitSet.get(a)) {
			System.out.println(a + ",重复");
		} else {
			System.out.println(a + ",不重复");
		}

	}

}

输出

15,不重复
26,重复

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值