1BitSet
底层存储是一个long数组,会将数据映射成long类型,默认初始化的时候为false,所以位数肯定为64的整数倍,没满64位的的都是false,这种规整操作可以使内存对齐,避免一些操作的复杂性。
使用数据存储表达了,64位作为一组,然后每组有64个位,当查询的时候,先确认在哪一组 i/64,然后是这个组的哪一位i%64
2.BitSet使用
将一组值映射到0/1,然后可以表达二元的语义,比如:“存在/不存在” “真/假”等,还可以减少占用的内存,还可以进行一些与或等位操作,表达更丰富的语义。
操作:
1)clear //置为零
2)将某一位clear
words[wordIndex] &= ~(1L << bitIndex);
3)clear(int fromIndex, int toIndex) 清空某一范围的bit
4)flip(int bitIndex) //翻转
words[wordIndex] ^= (1L << bitIndex);
flip(int fromIndex, int toIndex)
5)设置某一位
set(int bitIndex)
set(int bitIndex, boolean value)
6)get(int bitIndex) //获取某一位状态
8) length() //获取总bit的大小
9)hashCode 同时考虑了word及其位置,这样bit的状态发生变化,hashcode也会发生变化
转:
BitSet简介
类实现了一个按需增长的位向量。位 set 的每个组件都有一个boolean值。用非负的整数将BitSet的位编入索引。可以对每个编入索引的位进行测试、设置或者清除。通过逻辑与、逻辑或和逻辑异或操作,可以使用一个BitSet修改另一个BitSet的内容。
默认情况下,set 中所有位的初始值都是false。
每个位 set 都有一个当前大小,也就是该位 set 当前所用空间的位数。注意,这个大小与位 set 的实现有关,所以它可能随实现的不同而更改。位 set 的长度与位 set 的逻辑长度有关,并且是与实现无关而定义的。
除非另行说明,否则将 null 参数传递给BitSet中的任何方法都将导致NullPointerException。
在没有外部同步的情况下,多个线程操作一个BitSet是不安全的
基本原理
BitSet是位操作的对象,值只有0或1即false和true,内部维护了一个long数组,初始只有一个long,所以BitSet最小的size是64,当随着存储的元素越来越多,BitSet内部会动态扩充,最终内部是由N个long来存储,这些针对操作都是透明的。
用1位来表示一个数据是否出现过,0为没有出现过,1表示出现过。使用用的时候既可根据某一个是否为0表示,此数是否出现过。
一个1G的空间,有 8*1024*1024*1024=8.58*10^9bit,也就是可以表示85亿个不同的数
使用场景
常见的应用是那些需要对海量数据进行一些统计工作的时候,比如日志分析、用户数统计等等
如统计40亿个数据中没有出现的数据,将40亿个不同数据进行排序等。
现在有1千万个随机数,随机数的范围在1到1亿之间。现在要求写出一种算法,将1到1亿之间没有在随机数中的数求出来