由来,方便处理大数据的问题
比如,给你40亿个数,判断其中一个数是否存在
桶排序,或者哈希表的形式,消耗的内存太大,以及时间也会增加。
又或者是处理,40亿个数的排序。
于是对于处理这种数据规模十分庞大的数据集,那么比较好的方法就是
位图(bitmap)。
原理就是,类似桶排序的思想,桶排序是将相应的数,映射成的数组对应的下标,但是缺点是,如果数据集中,最大的数十分庞大,那么需要的数组的规模就十分庞大
而bitmap 就是借用计算机 byte(字节),一个字节8个bit位,而目前,int 在java是占用4个字节,所以就能表示0-31个数字的情况。
这个博客我推荐下:博客
主要是定位和判断数据存在否?
package com.hnist.lzn.bitmap;
import java.util.ArrayList;
import java.util.List;
public class BitMap {
private static final int N = 10000000;
private int[] a = new int[N/32+1];
// set 1
public void addValue(int n)
{
int row = n >> 5;
a[row] |= 1 << (n& 0x1F);
}
// 判断是否存在
public boolean exist(int n)
{
int row = n >> 5;
return (a[row] & (1 << (n & 0x1F))) !=1;
}
//
public void display(int row)
{
System.out.println("位图展示");
List<Integer> list = new ArrayList<>();
int temp = a[row];
for(int j = 0;j< 32;j++)
{
list.add(temp & 1);
temp >>= 1;
}
System.out.println("a["+row+"]"+list);
}
public static void main(String[] args) {
int num = 1000000;
BitMap map = new BitMap();
map.addValue(num);
if(map.exist(num))
{
System.out.println("temp:"+num+"has already exist");
}
map.display(num>>5);
}
}