bitmap及其应用

[[b]基本概念:[/b]
为了存放很多数据并且去重的时候,用一个bit位来标记某个元素对应的Value, 而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。
[b]实现思路(以存储int为例):[/b]
本来一个int是4个字节的,要存的话就需要4个字节的存储空间,但是若有大量数据要排重并且存储时,内存就可能会不够用,这个时候我们就可以用bitmap来解决。仍以存储int型数据为例,为了存储这大量的数据,我们如下面步骤实现:
1.开辟一块大小为2^29byte的空间(2^32/2^3=2^29)
2.将这块空间进行“编号”,其“编号”遍历了int范围(因为其大小就是int范围个的bit)
3.将数据逐个输入,将这些数据所对应的编号的空间置1
4.这些被置1的空间所对应的“编号”就是存在的int值,并且一定是去重了
[b]具体实现所遇问题:[/b]
1.可能一下子开辟不了如此大的一块存储空间
解决方案:可以“分批”开辟空间,不一定要连续
//分批创建byte组织,根据不同大小放到不同地byte数组中,对byte进行位操作,一个byte相当于8个bit
byte[] bytes1=new byte[1000];
byte[] bytes2=new byte[1000];
byte[] bytes3=new byte[1000];
byte[] bytes4=new byte[1000];
byte[] bytes5=new byte[1000];
byte[] bytes6=new byte[1000];
byte[] bytes7=new byte[1000];
byte[] bytes8=new byte[1000];
byte[] bytes9=new byte[192];

2.如何进行位操作
解决方案:本来可以用循环移位,然后将所需置1的位移到最前面“或”1再移位回原样即可,但是java中好像没有直接的循环移位,因此要自己写一个
[b]综合应用方面:[/b]
我们在平时打开网页时有些网页会在“黑名单”中,即不让我们访问的,如果用一般的搜索排除的话效率太低,那么如何高效率的判断该网页不在“黑名单”中呢?
答案:利用布隆过滤器
布隆过滤器:可以说是哈希表和bitmap的结合,先对每个黑名单网站网址的每个字符通过哈希表得到一个value,将该value所对应的在bitmap中的位置置1。当在要打开某个网页时会先对该网页的网址同样通过哈希表得到一些value,只要这些value所对应的bitmap中的值有一个不为1就说明该网址不在“黑名单”中。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值