BitSet的使用

1BitSet

  底层存储是一个long数组,会将数据映射成long类型,默认初始化的时候为false,所以位数肯定为64的整数倍,没满64位的的都是false,这种规整操作可以使内存对齐,避免一些操作的复杂性。

 

 使用数据存储表达了,64位作为一组,然后每组有64个位,当查询的时候,先确认在哪一组 i/64,然后是这个组的哪一位i%64

 

 

 

2.BitSet使用

 

      将一组值映射到0/1,然后可以表达二元的语义,比如:“存在/不存在” “真/假”等,还可以减少占用的内存,还可以进行一些与或等位操作,表达更丰富的语义。

      操作:

      1)clear  //置为零

      2)将某一位clear

words[wordIndex] &= ~(1L << bitIndex);

     3)clear(int fromIndex, int toIndex) 清空某一范围的bit

     4)flip(int bitIndex) //翻转

       words[wordIndex] ^= (1L << bitIndex);

     flip(int fromIndex, int toIndex)

    5)设置某一位 

         set(int bitIndex)

        set(int bitIndex, boolean value)

   6)get(int bitIndex) //获取某一位状态

   8) length() //获取总bit的大小

    9)hashCode 同时考虑了word及其位置,这样bit的状态发生变化,hashcode也会发生变化

    

 

  转:

BitSet简介
    类实现了一个按需增长的位向量。位 set 的每个组件都有一个boolean值。用非负的整数将BitSet的位编入索引。可以对每个编入索引的位进行测试、设置或者清除。通过逻辑与、逻辑或和逻辑异或操作,可以使用一个BitSet修改另一个BitSet的内容。

    默认情况下,set 中所有位的初始值都是false。

    每个位 set 都有一个当前大小,也就是该位 set 当前所用空间的位数。注意,这个大小与位 set 的实现有关,所以它可能随实现的不同而更改。位 set 的长度与位 set 的逻辑长度有关,并且是与实现无关而定义的。

    除非另行说明,否则将 null 参数传递给BitSet中的任何方法都将导致NullPointerException。

    在没有外部同步的情况下,多个线程操作一个BitSet是不安全的

基本原理
    BitSet是位操作的对象,值只有0或1即false和true,内部维护了一个long数组,初始只有一个long,所以BitSet最小的size是64,当随着存储的元素越来越多,BitSet内部会动态扩充,最终内部是由N个long来存储,这些针对操作都是透明的。

    用1位来表示一个数据是否出现过,0为没有出现过,1表示出现过。使用用的时候既可根据某一个是否为0表示,此数是否出现过。

    一个1G的空间,有 8*1024*1024*1024=8.58*10^9bit,也就是可以表示85亿个不同的数

使用场景
    常见的应用是那些需要对海量数据进行一些统计工作的时候,比如日志分析、用户数统计等等

    如统计40亿个数据中没有出现的数据,将40亿个不同数据进行排序等。
    现在有1千万个随机数,随机数的范围在1到1亿之间。现在要求写出一种算法,将1到1亿之间没有在随机数中的数求出来

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值