java.util.BitSet 研究(存数海量数据时的一个途径)

java.util.BitSet可以按位存储。
计算机中一个字节(byte)占8位(bit),我们java中数据至少按字节存储的,
比如一个int占4个字节。
如果遇到大的数据量,这样必然会需要很大存储空间和内存。
如何减少数据占用存储空间和内存可以用算法解决。
java.util.BitSet就提供了这样的算法。
比如有一堆数字,需要存储,source=[3,5,6,9]
用int就需要4*4个字节。
java.util.BitSet可以存true/false。
如果用java.util.BitSet,则会少很多,其原理是:
1,先找出数据中最大值maxvalue=9
2,声明一个BitSet bs,它的size是maxvalue+1=10
3,遍历数据source,bs[source[i]]设置成true.

最后的值是:
(0为false;1为true)
bs [0,0,0,1,0,1,1,0,0,1]
3, 5,6, 9

这样一个本来要int型需要占4字节共32位的数字现在只用了1位!
比例32:1

这样就省下了很大空间。

看看测试例子

package com;

import java.util.BitSet;

public class MainTestThree {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		BitSet bm=new BitSet();
		System.out.println(bm.isEmpty()+"--"+bm.size());
		bm.set(0);
		System.out.println(bm.isEmpty()+"--"+bm.size());
		bm.set(1);
		System.out.println(bm.isEmpty()+"--"+bm.size());
		System.out.println(bm.get(65));
		System.out.println(bm.isEmpty()+"--"+bm.size());
		bm.set(65);
		System.out.println(bm.isEmpty()+"--"+bm.size());
	}

}

输出:
true--64
false--64
false--64
false
false--64
false--128

说明默认的构造函数声明一个64位的BitSet,值都是false。
如果你要用的位超过了默认size,它会再申请64位,而不是报错。

package com;

import java.util.BitSet;

public class MianTestFour {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		BitSet bm1=new BitSet(7);
		System.out.println(bm1.isEmpty()+"--"+bm1.size());
		
		BitSet bm2=new BitSet(63);
		System.out.println(bm2.isEmpty()+"--"+bm2.size());
		
		BitSet bm3=new BitSet(65);
		System.out.println(bm3.isEmpty()+"--"+bm3.size());
		
		BitSet bm4=new BitSet(111);
		System.out.println(bm4.isEmpty()+"--"+bm4.size());
	}

}


输出:
true--64
true--64
true--128
true--128

说明你申请的位都是以64为倍数的,就是说你申请不超过一个64的就按64算,超过一个不超过
2个的就按128算。

package com;

import java.util.BitSet;

public class MainTestFive {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		int[] shu={2,42,5,6,6,18,33,15,25,31,28,37};
		BitSet bm1=new BitSet(MainTestFive.getMaxValue(shu));
		System.out.println("bm1.size()--"+bm1.size());
		
		MainTestFive.putValueIntoBitSet(shu, bm1);
		printBitSet(bm1);
	}
	
	//初始全部为false,这个你可以不用,因为默认都是false
	public static void initBitSet(BitSet bs){
		for(int i=0;i<bs.size();i++){
			bs.set(i, false);
		}
	}
	//打印
	public static void printBitSet(BitSet bs){
		StringBuffer buf=new StringBuffer();
		buf.append("[\n");
		for(int i=0;i<bs.size();i++){
			if(i<bs.size()-1){
				buf.append(MainTestFive.getBitTo10(bs.get(i))+",");
			}else{
				buf.append(MainTestFive.getBitTo10(bs.get(i)));
			}
			if((i+1)%8==0&&i!=0){
				buf.append("\n");
			}
		}
		buf.append("]");
		System.out.println(buf.toString());
	}
	//找出数据集合最大值
	public static int getMaxValue(int[] zu){
		int temp=0;
		temp=zu[0];
		for(int i=0;i<zu.length;i++){
			if(temp<zu[i]){
				temp=zu[i];
			}
		}
		System.out.println("maxvalue:"+temp);
		return temp;
	}
	//放值
	public static void putValueIntoBitSet(int[] shu,BitSet bs){
		for(int i=0;i<shu.length;i++){
			bs.set(shu[i], true);
		}
	}
	//true,false换成1,0为了好看
	public static String getBitTo10(boolean flag){
		String a="";
		if(flag==true){
			return "1";
		}else{
			return "0";
		}
	}

}



输出:
maxvalue:42
bm1.size()--64
[
0,0,1,0,0,1,1,0,
0,0,0,0,0,0,0,1,
0,0,1,0,0,0,0,0,
0,1,0,0,1,0,0,1,
0,1,0,0,0,1,0,0,
0,0,1,0,0,0,0,0,
0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0
]

这样便完成了存值和取值。
注意它会对重复的数字过滤,就是说,一个数字出现过超过2次的它都记成1.

出现的次数这个信息就丢了。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java.util.BitSetJava中的一个类,它实现了一个位向量,可以用来表示一组位值。它提供了一系列方法来操作位集合,比如设置位、清除位、翻转位等等。\[1\]在引用\[1\]的示例代码中,展示了如何使用BitSet类来进行位操作。首先创建了两个BitSet对象bits1和bits2,然后通过set方法设置了一些位的值。接下来,展示了如何使用AND、OR和XOR操作来对位集合进行逻辑运算。\[1\] 在引用\[2\]中的示例代码中,展示了如何使用BitSet类来判断一个字符串中的哪些字符出现过。通过遍历字符串的每个字符,使用set方法将对应的位设置为true。然后通过toString方法将出现过的字符以字符串的形式返回。\[2\] 在引用\[3\]中的代码片段中,展示了BitSet类的set方法的源码。该方法用于将指定索引处的位设置为true。\[3\] #### 引用[.reference_title] - *1* [JAVA Bitset类](https://blog.csdn.net/m0_37062111/article/details/128724495)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [java.util.BitSet](https://blog.csdn.net/zengxiantao1994/article/details/76514490)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [java.util.BitSet 分析 ](https://blog.csdn.net/lgshendy/article/details/84725100)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值