【面试专栏】第七篇:Java基础:集合篇-LinkedHashSet、BitSet、CopyOnWriteArraySet

🎉LinkedHashSet(继承自HashSet,底层是LinkedHashMap)

  • LinkedHashSet继承自HashSet,源码更少、更简单,唯一的区别是LinkedHashSet内部使用的是LinkHashMap。这样做的意义或者好处就是LinkedHashSet中的元素顺序是可以保证的,也就是说遍历序和插入序是一致的。

类声明

public class LinkedHashSet<E>
    extends HashSet<E>
    implements Set<E>, Cloneable, java.io.Serializable {}

构造方法

public LinkedHashSet(int initialCapacity, float loadFactor) {
    super(initialCapacity, loadFactor, true);
}

/**
 * Constructs a new, empty linked hash set with the specified initial
 * capacity and the default load factor (0.75).
 *
 * @param   initialCapacity   the initial capacity of the LinkedHashSet
 * @throws  IllegalArgumentException if the initial capacity is less
 *              than zero
 */
public LinkedHashSet(int initialCapacity) {
    super(initialCapacity, .75f, true);
}

/**
 * Constructs a new, empty linked hash set with the default initial
 * capacity (16) and load factor (0.75).
 */
public LinkedHashSet() {
    super(16, .75f, true);
}
  • super指的是HashSet的default访问级别的构造方法
/**
 * Constructs a new, empty linked hash set.  (This package private
 * constructor is only used by LinkedHashSet.) The backing
 * HashMap instance is a LinkedHashMap with the specified initial
 * capacity and the specified load factor.
 *
 * @param      initialCapacity   the initial capacity of the hash map
 * @param      loadFactor        the load factor of the hash map
 * @param      dummy             ignored (distinguishes this
 *             constructor from other int, float constructor.)
 * @throws     IllegalArgumentException if the initial capacity is less
 *             than zero, or if the load factor is nonpositive
 */
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
    map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

🎉 BitSet(位集,底层是long数组,用于替代List)

  • BitSet是位操作的对象,值只有0或1即false和true,内部维护了一个long数组,初始只有一个long,所以BitSet最小的size是64(8个字节64个位,可以存储64个数字),当随着存储的元素越来越多,BitSet内部会动态扩充,最终内部是由N个long来存储,这些针对操作都是透明的。

  • 默认情况下,BitSet的所有位都是false即0。

  • 不是线程安全的。

  • 用1位来表示一个数据是否出现过,0为没有出现过,1表示出现过。使用的时候既可根据某一个是否为0表示,此数是否出现过。

  • 一个1GB的空间,有8102410241024 = 8.5810^9bit,也就是1GB的空间可以表示85亿多个数。

  • 常见的应用是那些需要对海量数据进行一些统计工作的时候,比如日志分析、用户数统计等等,如统计40亿个数据中没有出现的数据,将40亿个不同数据进行排序,海量数据去重等等。

  • JDK选择long数组作为BitSet的内部存储结构是出于性能的考虑,因为BitSet提供and和or这种操作,需要对两个BitSet中的所有bit位做and或者or,实现的时候需要遍历所有的数组元素。使用long能够使得循环的次数降到最低,所以Java选择使用long数组作为BitSet的内部存储结构。
    BitSet()
    创建一个新的位 set。
    BitSet(int nbits)
    创建一个位 set,它的初始大小足以显式表示索引范围在 0 到 nbits-1 的位。
    void and(BitSet set)
    对此目标位 set 和参数位 set 执行逻辑与操作。
    void andNot(BitSet set)
    清除此 BitSet 中所有的位,其相应的位在指定的 BitSet 中已设置。
    int cardinality()
    返回此 BitSet 中设置为 true 的位数。
    void clear()
    将此 BitSet 中的所有位设置为 false。
    void clear(int bitIndex)
    将索引指定处的位设置为 false。
    void clear(int fromIndex, int toIndex)
    将指定的 fromIndex(包括)到指定的 toIndex(不包括)范围内的位设置为 false。
    Object clone()
    复制此 BitSet,生成一个与之相等的新 BitSet。
    boolean equals(Object obj)
    将此对象与指定的对象进行比较。
    void flip(int bitIndex)
    将指定索引处的位设置为其当前值的补码。
    void flip(int fromIndex, int toIndex)
    将指定的 fromIndex(包括)到指定的 toIndex(不包括)范围内的每个位设置为其当前值的补码。
    boolean get(int bitIndex)
    返回指定索引处的位值。
    BitSet get(int fromIndex, int toIndex)
    返回一个新的 BitSet,它由此 BitSet 中从 fromIndex(包括)到 toIndex(不包括)范围内的位组成。
    int hashCode()
    返回此位 set 的哈希码值。
    boolean intersects(BitSet set)
    如果指定的 BitSet 中有设置为 true 的位,并且在此 BitSet 中也将其设置为true,则返回 ture。
    boolean isEmpty()
    如果此 BitSet 中没有包含任何设置为 true 的位,则返回 ture。
    int length()
    返回此 BitSet 的“逻辑大小”:BitSet 中最高设置位的索引加 1。
    int nextClearBit(int fromIndex)
    返回第一个设置为 false 的位的索引,这发生在指定的起始索引或之后的索引上。
    int nextSetBit(int fromIndex)
    返回第一个设置为 true 的位的索引,这发生在指定的起始索引或之后的索引上。
    void or(BitSet set)
    对此位 set 和位 set 参数执行逻辑或操作。
    void set(int bitIndex)
    将指定索引处的位设置为 true。
    void set(int bitIndex, boolean value)
    将指定索引处的位设置为指定的值。
    void set(int fromIndex, int toIndex)
    将指定的 fromIndex(包括)到指定的 toIndex(不包括)范围内的位设置为 true。
    void set(int fromIndex, int toIndex, boolean value)
    将指定的 fromIndex(包括)到指定的 toIndex(不包括)范围内的位设置为指定的值。
    int size()
    返回此 BitSet 表示位值时实际使用空间的位数。
    String toString()
    返回此位 set 的字符串表示形式。
    void xor(BitSet set)
    对此位 set 和位 set 参数执行逻辑异或操作。

去重示例

public static void containChars(String str) {
    BitSet used = new BitSet();
    for (int i = 0; i < str.length(); i++)
        used.set(str.charAt(i)); // set bit for char  
    StringBuilder sb = new StringBuilder();
    sb.append("[");
    int size = used.size();
    for (int i = 0; i < size; i++) {
        if (used.get(i)) {
            sb.append((char) i);
        }
    }
    sb.append("]");
    System.out.println(sb.toString());
}

public static void main(String[] args) {
    containChars("abcdfab");
}
  • [abcdf]

排序示例

public static void sortArray(int[] array) {

    BitSet bitSet = new BitSet(2 << 13);
    // 虽然可以自动扩容,但尽量在构造时指定估算大小,默认为64  
    System.out.println("BitSet size: " + bitSet.size());

    for (int i = 0; i < array.length; i++) {
        bitSet.set(array[i]);
    }
    //剔除重复数字后的元素个数  
    int bitLen = bitSet.cardinality();

    //进行排序,即把bit为true的元素复制到另一个数组  
    int[] orderedArray = new int[bitLen];
    int k = 0;
    for (int i = bitSet.nextSetBit(0); i >= 0; i = bitSet.nextSetBit(i + 1)) {
        orderedArray[k++] = i;
    }

    System.out.println("After ordering: ");
    for (int i = 0; i < bitLen; i++) {
        System.out.print(orderedArray[i] + "\t");
    }
}

public static void main(String[] args) {
    int[] array = new int[]{423, 700, 9999, 2323, 356, 6400, 1, 2, 3, 2, 2, 2, 2};
    sortArray(array);
}
  • BitSet size: 16384
  • After ordering:
  • 1 2 3 356 423 700 2323 6400 9999

🎉 CopyOnWriteArraySet(底层是CopyOnWriteArrayList)

  • 基于CopyOnWriteArrayList实现,其唯一的不同是在add时调用的是CopyOnWriteArrayList的addIfAbsent方法。
  • 在每次add的时候都要进行数组的遍历,因此其性能会略低于CopyOnWriteArrayList。

成员变量

private final CopyOnWriteArrayList<E> al;

构造方法

public CopyOnWriteArraySet() {
    al = new CopyOnWriteArrayList<E>();
}

添加

public boolean add(E e) {
    return al.addIfAbsent(e);
}

删除

public boolean remove(Object o) {
    return al.remove(o);
}

遍历

public Iterator<E> iterator() {
    return al.iterator();
}

包含

public boolean contains(Object o) {
    return al.contains(o);
}
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

木秀林

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值