为什么HashSet里面add的时候,不可以add相同的值,
为什么可以用HashSet的这个不重复的值的特性来去重复呢。
为什么要用HashSet去重复的时候,要重写Java model的hashcode和equal方法
先看如下HashSet的几个构造方法如下:
/**
* Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
* default initial capacity (16) and load factor (0.75).
*/
public HashSet() {
map = new HashMap<>();
}
public HashSet(Collection<? extends E> c) {
//这个就是在初始化hashmap的时候,给个合适大小的初始容量的算法;他不是直接给传入集合的size(),而是有点变化;至于具体原因,你得了解hashmap才行。
//原理同guava的Maps.newHashMapWithExpectedSize()
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
}
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
}
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}
//这个是包内权限(知道不?不知道自己查下吧),不对外的一个构造方法
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
//类内部的map如下声明:
private transient HashMap<E,Object> map;
//Dummy value to associate with an Object in the backing Map//翻译:在支持映射中给一个对象关联的伪值
private static final Object PRESENT = new Object();
public boolean add(E e) { return map.put(e, PRESENT)==null; }
再看上面的add方法,其实就是向这个map里面put();到这里,
由此可知HashSet的值是存储在一个HashMap的key里面的,而正好HashMap的key是不能重复的
如果你知道hashmap的原理,就好说,
如果不知道,那也好说,那你知道在往hashmap里面put的时候,如果put(key,value)的key相同的话,是不是就是把原来的旧值给覆盖啦
HashMap在add()时候,
若key没有存值,则存进去,返回oldValue;此值初始值是null;
若key已经有值了,那么add成功也返回oldValue,返回的是上次的值就不为null啦;也就解释了上面的add中 == null 为false啦。set的add失败啦。
再次总结一下:
HashSet的add()就是往一个HashMap里面put(),只是key一直不同,而value是一直相同的就是上面的那个伪值---PRESENT。
HashSet的值是存储在一个HashMap的key里面,而HashMap的key是不能重复的.
HashSet的其他方法如下:
public int size() { return map.size(); }
public boolean isEmpty() { return map.isEmpty(); }
public boolean contains(Object o) { return map.containsKey(o); }
public boolean remove(Object o) { return map.remove(o)==PRESENT; }
public void clear() { map.clear(); }
下面附赠几个链接,可以看一下: