BitSet的应用

本文介绍了Java中的BitSet数据结构,用于高效处理大数据量的查找、去重、统计等任务。通过BitSet实现电话号码查找、随机数统计、素数计数,并讨论了其在垃圾邮件识别中的应用——布隆过滤器。BitSet虽然非线程安全,但在适当同步下,可应用于多线程环境。
摘要由CSDN通过智能技术生成

1.BitSet介绍

BitSet是用于存储二进制位和对二进制进行操作的Java数据结构,BitSet从jdk1.0开始就有了。它存储的是二进制位在BitSet中状态,根据对这些状态的判断,可以有很多应用。以前对数据的操作都是先把数据都是存储在内存中间的,现在可以通过设置BitSet的相应位达到存储数据信息的目的,极大的节省了内存空间。

2.BitSet应用

BitSet可以做的事情主要分为以下几类:

(1)大数据量的查找。

(2)大数据量的去重。

(3)大数据量的统计。

(4)大数据量的排序。

(5)求数据的并集、交集、补集等。

(6)大数据量的判别。

BitSet常见的应用是那些对海量数据进行一些统计工作,比如日志分析、用户数统计等等。

BitSet能够做以上事情主要依靠BitSet的基本操作,对应的常用方法:

(1)初始化一个BitSet。使用构造函数BitSet( )BitSet(int nbits)

(2)设置BitSet的某一指定位。就是把指定位存放入BitSet,使用设置函数set(int bitIndex)

(3)获取BitSet的某一位的状态。就是判断指定位是否在BitSet中,boolean型的返回值,使用函数get(int bitIndex)。

(4)清空BitSet或清空BitSet的某一指定位。就是把BitSet所有位或指定位清除,使用清空函数clear( )clear(int bitIndex)

不过使用BitSet有一点需要注意:在没有外部同步的情况下,多个线程操作一个BitSet是不安全的。所以在多线程环境下使用BitSet要考虑线程安全的问题,可以使用多线程安全策略确保多个线程在执行过程中的的线程安全性。也就是BitSet是非线程安全的,需要外部同步。

2.BitSet应用举例

下面就来看一个BitSet应用的具体例子。

(1)使用BitSet查找电话号码

从一堆数量大概在千万级的电话号码列表中找出所有重复的电话号码,需要时间复杂度尽可能小。

如果这个问题使用暴力搜索时间复杂度太高,就不考虑这种解决方案。

容易想到的办法就是建立一个标志数组,int boolean都行,用相应的位置值来代替这个号码是否出现,根据数组的可直接存取特性,来提高效率。比如电话号“8832061”如果存在,就把他放入数组的第8832061位设置该位的值为1或true。

但是这样做有一个缺点就是int型的字段太过于占空间,我们只需要知道这个号码存在与否,所以最简单的0和1就够用了,能表示0和1的最小存储单位是什么呢?是内存中的一位。BitSet是用于存储二进制位和对二进制进行操作的数据结构。

之前int型的一个电话号码的状态要占4个字节,现在使用BitSet存储出现的电话号码的位置,而且BitSet有自动去重功能。8bit是1byte,int占用4byte,那么使用的空间大小就缩小了4*8 = 32倍。使用了内存大大减少。

下面的简单代码给出了BitSet的例子:

import java.util.BitSet;
public class BitSetDemo {

    public static void main(String[] args) {

        //创建一个具有10000000位的bitset 初始所有位的值为false
        BitSet bitSet = new BitSet(10000000);
        //将指定位的值设为true
        bitSet.set(9999);
        //或者bitSet.set(9999,true);
        //输出指定位的值
        System.out.println("9999:"+bitSet.get(9999));
        System.out.println("9998:"+bitSet.get(9998));

    }
}

程序运行结果:第一行输入“true”,第二个输出“false”。

  • 3
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Redis Bitset是一种数据结构,它可以用于存储和操作位(bit)的集合。通过使用Redisson提供的相关API,如RBitSet,可以创建和管理Redis Bitset。[1] RBitSet提供了一些常见的操作,比如设置位,过期时间等。 需要注意的是,Redis并不保证数据的强一致性。这意味着在实际的集群中,在特定的条件下,可能会丢失写操作。对于Redis集群之间的复制,具体的实现是通过主从部署架构和哨兵机制来实现的。这种架构可以提供高可用性,但不保证数据的零丢失。 因此,当使用Redis Bitset时,需要注意数据的一致性和可靠性,并在实际应用中根据需求做出相应的权衡和决策。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Redis之BitSet](https://blog.csdn.net/Best_Lynn/article/details/129592065)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [redis场景知识分析,基本结构整理](https://blog.csdn.net/weixin_56993128/article/details/125671579)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值