Java 集合及底层源码分析(1)

//1.执行HashSet()

public HashSet() {

map = new HashMap<>();

}

//2.执行add()

public boolean add(E e) {

return map.put(e, PRESENT)==null;

}

//3.执行put()

public V put(K key, V value) {

return putVal(hash(key), key, value, false, true);

}

static final int hash(Object key) {

int h;

return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);//对hash值进行无符号右移16位,防止冲突

}

//4.执行putVal()

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,

boolean evict) {

Node<K,V>[] tab; Node<K,V> p; int n, i;

//tab其实HashMap的一个数组,类型是 Node[],第一次扩容,到16个空间

if ((tab = table) == null || (n = tab.length) == 0)

n = (tab = resize()).length;

//根据Key得到一个hash值,然后计算该key在tab中所对应的索引下标,并把这个索引对应的元素赋给p

//if p == null 表示该位置还没有存放元素,就创建一个Node

if ((p = tab[i = (n - 1) & hash]) == null)

tab[i] = newNode(hash, key, value, null);

else {

Node<K,V> e; K k;

//判断当前添加的对象的引用或者内容是否相同,前提是他们的hash值要相同,如果满足条件的话则不嫩加入

if (p.hash == hash &&

((k = p.key) == key || (key != null && key.equals(k))))

e = p;

//否则再判断是否是一颗红黑树,如果是一颗红黑树,则采用红黑树的算法进行

else if (p instanceof TreeNode)

e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

else {

//否则如果是一个链表,则依次循环比较,如果找到相同的就退出,否则把当前对象放在尾部即可

for (int binCount = 0; ; ++binCount) {

if ((e = p.next) == null) {

p.next = newNode(hash, key, value, null);

if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st

treeifyBin(tab, hash);

break;

}

if (e.hash == hash &&

((k = e.key) == key || (key != null && key.equals(k))))

break;

p = e;

}

}

if (e != null) { // existing mapping for key

V oldValue = e.value;

if (!onlyIfAbsent || oldValue == null)

e.value = value;

afterNodeAccess(e);

return oldValue;

}

}

++modCount;

if (++size > threshold)

resize();

afterNodeInsertion(evict);

return null;

}

LinkedHashSet

LinkedHashSet 底层是一个LInkedHashMap,底层维护了一个数组+双向链表

LInkedHashSet根据元素的HashCode值来决定元素的位置,同时使用链表维护元素的次序,这使得元素看起来是以插入的顺序保存的

LInkedHashSet 不允许添加重复元素

Map集合


Map与Collection并列存在。用时于保存具有映射关系的数据:Key-Value

Map中的key 和value可以是任何引用类型的数据,会封装到HashMap $Node对象中

Map中的key 不允许重复,原因和HashSet一样,前面分析过源码,Map 中的value可以重复

Map 的key可以为null, value 也可以为null,注意key为null,只能有一个,value为null ,可以多个

常用String类作为Map的key,但并不是所有只能用String作为key,kev和value之间存在单向一对一关系,即通过指定的 kev总能找到对应的value

k-v形式最终会是 HashMap $Node node = newNode(hash, key,value,null)

k-v为了方便程序员的遍历,还会创建 EntrySet集合,该集合存放的元素的类型 Entry,而一个Entry对象就有k,v ,EntrySet<Entry<K,V>>即:transient Set<Map. Entry<K,V>> entrySet;

entrySet中,定义的类型是 Map.Entry ,但是实际上存放的还是 HashMap $Node

这是因为static class Node<K,V> implements Map.Entry<K, V>,当把 HashMap $Node对象存放到entrySet时就方便我们的遍历

Map 接口的遍历方式

  1. 通过keySet获取map里所有的键,获取键后返回一个集合,可采用集合的遍历增强for或者迭代器 iterator进行遍历

  2. 通过values获取所有的value集合,可通过集合的方式遍历

  3. 通过entrySet获取所有的关系k-v,可通过集合的遍历

HashMap

HashMap底层维护了Node类型的数组table,默认为null

当创建对象时,将加载因子(loadfactor)初始化为0.75.

当添加key-val时,通过key的哈希值得到在table的索引。然后判断该索引处是否有元素,如果没有元素直接添加。如果该索引处有元素,继续判断该元素的key和准备加入的key相是否等,如果相等,则直接替换val;如果不相等需要判断是树结构还是链表结构,做出相应处理。如果添加时发现容量不够,则需要扩容。

第1次添加,则需要扩容table容量为16,临界值(threshold)为12(16*0.75)

以后再扩容,则需要扩容table容量为原来的2倍(32),临界值为原来的2倍,即24.依次类推

在Java8中,如果一条链表的元素个数超过 TREEIFY_THRESHOLD(默认是8),table的大小 >= MIN_TREEIFY_ CAPACITY(默认64),就会进行树化(红黑树)

源代码分析及结论

同HashSet一样,因为HashSet底层是HashMap

Hashtable

存放的元素是键值对:即K-V

hashtable的键和值都不能为null,否则会抛出NullPointerException3) hashTable使用方法基本上和HashMap一样

hashTable是线程安全的(synchronized), hashMap是线程不安全的

源代码分析及结论

  1. Hashtable底层维护的也是一个数组Hashtable$Entry[] 初始化大小为11

  2. 临界值等于11*0.75 =8

  3. 扩容机制:当加入的数量到达临界值是,扩容量为原来的2倍+1,即:newCapacity = (oldCapacity << 1) + 1;

  4. 当加入相同相同key对应的value时,则进行value替换

private void addEntry(int hash, K key, V value, int index) {

modCount++;

Entry<?,?> tab[] = table;

if (count >= threshold) {

// Rehash the table if the threshold is exceeded

rehash();

tab = table;

hash = key.hashCode();

index = (hash & 0x7FFFFFFF) % tab.length;

}

// Creates the new entry.

@SuppressWarnings(“unchecked”)

Entry<K,V> e = (Entry<K,V>) tab[index];

tab[index] = new Entry<>(hash, key, value, e);

count++;

}

protected void rehash() {

int oldCapacity = table.length;

Entry<?,?>[] oldMap = table;

// overflow-conscious code

int newCapacity = (oldCapacity << 1) + 1;//扩容机制

if (newCapacity - MAX_ARRAY_SIZE > 0) {

if (oldCapacity == MAX_ARRAY_SIZE)

// Keep running with MAX_ARRAY_SIZE buckets

return;

newCapacity = MAX_ARRAY_SIZE;

}

Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];

modCount++;

threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);

table = newMap;

for (int i = oldCapacity ; i-- > 0 😉 {

for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) {

Entry<K,V> e = old;

old = old.next;

int index = (e.hash & 0x7FFFFFFF) % newCapacity;

e.next = (Entry<K,V>)newMap[index];

newMap[index] = e;

}

}

}

关于Hashtable和HashMap的对比:

| | 版本 | 线程安全(同步) | 效率 | 允许null键null值 |

| :-: | :-: | :-: | :-: | :-: |

| Hashtable | 1.0 | 安全 | 不高 | 不允许 |

| HashMap | 1.2 | 不安全 | 高 | 允许 |

Properties

  1. Properties类继承自Hashtable类并且实现了Map接口,也是使用一种键值对的形

式来保存数据,他的使用特点和Hashtable类似

  1. Properties 还可以用于从 xxx.properties 文件中,加载数据到Properties类对象,

并讲行卖取和修改

相关知识点:https://www.cnblogs.com/xudong-bupt/p/3758136.html

TreeSet

TreeSet底层实际上是TreeMap

可排序(可安自定义的方式进行排序输出,底层插入顺序和取出顺序一致,不是add的顺序,是经过比较器计算后的顺序)

源代码分析及结论

  1. 当使用无参构造创建一个对象是,会默认将key转成比较器对象(前提是该key必须实现Comparable且实现了compareTo方法),使用默认的compareTo方法进行自然排序

  2. 当使用有参构造时,需要传入一个含有compare方法的比较器对象,然后TreeSet底层会将其封装给TreeMap对象中的comparator,底层加入是会自动调用该方法进行排序

  3. 如果TreeSet存放的是Integer对象,默认排序方法为 小到大;

  4. 如果TreeSet存放的是String对象,默认排序方法为字符串首字母开始比较,按Unicode值大小排序;

  5. 如果TreeSet存放的是自定义类;如果不指定指定比较器,那么就会报异常;

public V put(K key, V value) {

Entry<K,V> t = root;

if (t == null) {

compare(key, key); // type (and possibly null) check//第一次添加的时候调用比较,判断是不是能进行比较

root = new Entry<>(key, value, null);

size = 1;

modCount++;

return null;

}

int cmp;

Entry<K,V> parent;

// split comparator and comparable paths

Comparator<? super K> cpr = comparator;

if (cpr != null) {

do {

parent = t;

cmp = cpr.compare(key, t.key);//传入的比较器对象,含有自定义的compare方法

if (cmp < 0)

t = t.left;

else if (cmp > 0)

t = t.right;

else

return t.setValue(value);

} while (t != null);

}

else {

if (key == null)

throw new NullPointerException();

@SuppressWarnings(“unchecked”)

Comparable<? super K> k = (Comparable<? super K>) key;//默认比较方法,前提是key必须实现Comparable接口

do {

parent = t;

cmp = k.compareTo(t.key);

if (cmp < 0)

t = t.left;

else if (cmp > 0)

t = t.right;

else

return t.setValue(value);

} while (t != null);

}

Entry<K,V> e = new Entry<>(key, value, parent);

if (cmp < 0)

parent.left = e;

else

parent.right = e;

fixAfterInsertion(e);

size++;

modCount++;

return null;

}

TreeMap

TreeMap的底层原理如上,只是TreeSet在put的时候value是固定的

开发中如何选择集合实现类


在开发中,选择什么集合实现类,主要取决于业务操作特点,然后根据集合实现类特性进行选择,分析如下:

先判断存储的类型(一组对象[单列]或一组键值对[双列])

  1. 一组对象[单列]:Collection接口

允许重复:List

增删多:LinkedList [底层维护了一个双向链表]

改查多: ArrayList[底层维护Object类型的可变数组]

不允许重复:Set

无序: HashSet [底层是HashMap,维护了一个哈希表即(数组+链表+红黑树)] (插入和取出的顺序不一致)

排序:TreeSet

插入和取出顺序一致: LinkedHashSet,维护数组+双向链表

  1. 一组键值对[双列]:Map

键无序: HashMap [底层是:哈希表 jdk7:数组+链表,jdk8:数组+链表+红黑树]

键排序:TreeMap

键插入和取出顺序一致:LinkedHashMap

读取文件Properties

Iterator遍历


当退出while循环后,这时iterator迭代器,指向最后的元素,如果希望再次遍历,需要重置我们的迭代器

最后

笔者已经把面试题和答案整理成了面试专题文档

image

image

image

image

image

image

键值对[双列]:Map

键无序: HashMap [底层是:哈希表 jdk7:数组+链表,jdk8:数组+链表+红黑树]

键排序:TreeMap

键插入和取出顺序一致:LinkedHashMap

读取文件Properties

Iterator遍历


当退出while循环后,这时iterator迭代器,指向最后的元素,如果希望再次遍历,需要重置我们的迭代器

最后

笔者已经把面试题和答案整理成了面试专题文档

[外链图片转存中…(img-WV8uyvB7-1714319125158)]

[外链图片转存中…(img-We1f4G3a-1714319125159)]

[外链图片转存中…(img-3CaCgGb0-1714319125159)]

[外链图片转存中…(img-8YN5g8Pw-1714319125159)]

[外链图片转存中…(img-dYuiUknj-1714319125160)]

[外链图片转存中…(img-UWZc8Zb0-1714319125160)]

本文已被CODING开源项目:【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值