BitSet---Java!!!

原创 2016年08月29日 19:17:56

一些处理大数据类的算法中要用到bitmap思想

Java中也有对应的实现,java.util.BitSet,

完全是为这个量身定做的java类,

大家用的时候要当心。

另外BitSet是非线程安全的,需要外部同步。


//创建一个具有10000000位的bitset 初始所有位的值为false  
        java.util.BitSet bitSet = new java.util.BitSet(10000000);  
        //将指定位的值设为true  
        bitSet.set(9999, true);  
        //输出指定位的值  
        System.out.println(bitSet.get(9999));  
        System.out.println(bitSet.get(9998));  

BitSet类

大小可动态改变, 取值为true或false的位集合。用于表示一组布尔标志。   

此类实现了一个按需增长的位向量。

位 set 的每个组件都有一个 boolean 值。用非负的整数将 BitSet 的位编入索引。

可以对每个编入索引的位进行测试、设置或者清除。

通过逻辑与、逻辑或和逻辑异或操作,可以使用一个 BitSet 修改另一个 BitSet 的内容。

默认情况下,set 中所有位的初始值都是 false。

每个位 set 都有一个当前大小,也就是该位 set 当前所用空间的位数。

注意,这个大小与位 set 的实现有关,所以它可能随实现的不同而更改。

位 set 的长度与位 set 的逻辑长度有关,并且是与实现无关而定义的。

除非另行说明,否则将 null 参数传递给 BitSet 中的任何方法都将导致 NullPointerException。 

在没有外部同步的情况下,多个线程操作一个 BitSet 是不安全的。

(2) 构造函数: BitSet() or BitSet(int nbits)

(3) 一些方法 
public void set(int pos): 位置pos的字位设置为true。 
public void set(int bitIndex, boolean value) 将指定索引处的位设置为指定的值。 
public void clear(int pos): 位置pos的字位设置为false。
public void clear() : 将此 BitSet 中的所有位设置为 false。 
public int cardinality() 返回此 BitSet 中设置为 true 的位数。 
public boolean get(int pos): 返回位置是pos的字位值。 
public void and(BitSet other): other同该字位集进行与操作,结果作为该字位集的新值。 
public void or(BitSet other): other同该字位集进行或操作,结果作为该字位集的新值。 
public void xor(BitSet other): other同该字位集进行异或操作,结果作为该字位集的新值。
public void andNot(BitSet set) 清除此 BitSet 中所有的位,set - 用来屏蔽此 BitSet 的 BitSet
public int size(): 返回此 BitSet 表示位值时实际使用空间的位数。
public int length() 返回此 BitSet 的“逻辑大小”:BitSet 中最高设置位的索引加 1。 
public int hashCode(): 返回该集合Hash 码, 这个码同集合中的字位值有关。 
public boolean equals(Object other): 如果other中的字位同集合中的字位相同,返回true。 
public Object clone() 克隆此 BitSet,生成一个与之相等的新 BitSet。 
public String toString() 返回此位 set 的字符串表示形式。

例1:标明一个字符串中用了哪些字符

import java.util.BitSet;
public class WhichChars{
   private BitSet used = new BitSet();
   public WhichChars(String str){
      for(int i=0;i< str.length();i++)
        used.set(str.charAt(i));  // set bit for char
   }
    public String toString(){
         String desc="[";
         int size=used.size();
          for(int i=0;i< size;i++){
             if(used.get(i))
                 desc+=(char)i;
            }
             return desc+"]";
         }
    public static void main(String args[]){
        WhichChars w=new WhichChars("How do you do");
        System.out.println(w);
    }
   }

[ Hdouwy]

2. Java.util.BitSet 研究(存数海量数据时的一个途径)
java.util.BitSet可以按位存储。

计算机中一个字节(byte)占8位(bit),我们java中数据至少按字节存储的,比如一个int占4个字节。

java.util.BitSet就提供了这样的算法。
比如有一堆数字,需要存储,source=[3,5,6,9] ,用int就需要4*4个字节。

java.util.BitSet可以存true/false。

其原理是:
1,先找出数据中最大值maxvalue=9
2,声明一个BitSet bs,它的size是maxvalue+1=10
3,遍历数据source,bs[source[i]]设置成true.

最后的值是:
(0为false;1为true)
bs [0,0,0,1,0,1,1,0,0,1]
              3,   5,6,      9
这样一个本来要int型需要占4字节共32位的数字现在只用了1位!






Java BitSet(位集)

原理简介:         Java平台的BitSet用于存放一个位序列,如果要高效的存放一个位序列,就可以使用位集(BitSet)。由于位集将位包装在字节里,所以使用位集比使用Boolean对象的L...

【JAVA】BitSet的源码研究

转:http://www.cnblogs.com/lqminn/archive/2012/08/30/2664122.html 这几天看Bloom Filter,因为在java中,并不能像C...

使用BitSet查找某个范围内的所有的素数的个数(摘自java核心技术.卷I)

import java.util.*; /** * This program runs the Sieve of Erathostenes benchmark. It computes all p...

jdk 源码分析(6)java BitSet结构

如果有一个Set 里面存放了(整数)1,3,4,5,23,23,12,65这些数,如果直接存储需要8×32位 ; 如果采用位图,只需要用两个long整型串联。...

Java BitSet 使用及部分源码学习

BitSet的使用在很多场景都十分有用,例如
  • zjx409
  • zjx409
  • 2014年07月08日 19:41
  • 931

java中的BitSet学习

(1)BitSet类     大小可动态改变, 取值为true或false的位集合。用于表示一组布尔标志。    此类实现了一个按需增长的位向量。位 set 的每个组件都有一个 boolean...

Java中BitSet的实现

编程珠玑中第一篇讲的就是使用bitmap来排序大文件里面的数据。下面给出一个简单的BitMap实现。 主要使用Byte数组。主要就是使用位运算来设置为某位的bit为1;   Java代码 ...

java中的BitSet学习

java中的BitSet学习 分类: 算法 Java SE 2012-08-09 21:50 338人阅读 评论(0) 收藏 举报 (1)BitSe...

java.util.BitSet 研究(存数海量数据时的一个途径)

java.util.BitSet可以按位存储。 计算机中一个字节(byte)占8位(bit),我们java中数据至少按字节存储的, 比如一个int占4个字节。 如果遇到大的数据量,这样必然会需要...

Java BitSet(位集)

原理简介:         Java平台的BitSet用于存放一个位序列,如果要高效的存放一个位序列,就可以使用位集(BitSet)。由于位集将位包装在字节里,所以使用位集比使用Boolean对象的L...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:BitSet---Java!!!
举报原因:
原因补充:

(最多只允许输入30个字)