JAVA集合框架--Set/Map/List

最新推荐文章于 2022-08-18 11:21:47 发布

冰の樱

最新推荐文章于 2022-08-18 11:21:47 发布

阅读量244

点赞数

本文链接：https://blog.csdn.net/weixin_43847183/article/details/109266971

版权

JAVA集合框架

本博客集合了多个博客的知识总结，尾部带有所有参考博客的博客链接

在这里插入图片描述

在这里插入图片描述
　　集合可以看作是一种容器，用来存储对象信息。所有集合类都位于java.util包下，但支持多线程的集合类位于java.util.concurrent包下。

数组与集合的区别如下：

1）数组长度不可变化而且无法保存具有映射关系的数据；集合类用于保存数量不确定的数据，以及保存具有映射关系的数据。

2）数组元素既可以是基本类型的值，也可以是对象；集合只能保存对象。

Java集合类主要由两个根接口Collection和Map派生出来的，Collection派生出了三个子接口：List、Set、Queue（Java5新增的队列），因此Java集合大致也可分成List、Set、Queue、Map四种接口体系，（注意：Map不是Collection的子接口）。

其中List代表了有序可重复集合，可直接根据元素的索引来访问；Set代表无序不可重复集合，只能根据元素本身来访问；Queue是队列集合；Map代表的是存储key-value对的集合，可根据元素的key来访问value。

上图中淡绿色背景覆盖的是集合体系中常用的实现类，分别是ArrayList、LinkedList、ArrayQueue、HashSet、TreeSet、HashMap、TreeMap等实现类。

Set(无序，不可以重复元素)

1.HashSet

HashSet是Set集合最常用实现类，是其经典实现。HashSet是按照hash算法来存储元素的，因此具有很好的存取和查找性能。

HashSet具有如下特点：

不能保证元素的顺序(顺序与添加顺序不同)。
HashSet不是线程同步的(底层数据结构是哈希表。是线程不安全的)，如果多线程操作HashSet集合，则应通过代码来保证其同步。
集合元素值可以是null。

当向HashSet集合存储一个元素时：

HashSet会调用该对象的hashCode()方法得到其hashCode值，然后根据hashCode值决定该对象的存储位置。

HashSet保证元素唯一性

HashSet集合判断两个元素相等的标准是：

两个对象的**hashCode()**方法返回值相等。
两个对象通过**equals()**方法比较返回true；

因此，如果(1)和(2)有一个不满足条件，则认为这两个对象不相等，可以添加成功。

如果元素的HashCode值相同，才会判断equals是否为true。如果元素的hashcode值不同，不会调用equals。

如果两个对象的hashCode()方法返回值相等，但是两个对象通过equals()方法比较返回false，HashSet会以链式结构将两个对象保存在同一位置，这将导致性能下降，因此在编码时应避免出现这种情况。

当你添加相同的字符串进去的时候，不会添加成功。

其中，在HashSet中，String类已经重写了hashcode()方法和equals()方法，用来比较指向的字符串对象所存储的字符串是否相等。

插一下equals与==比较：
java的类型包括两类，一个为基础数据类型，一个为引用类型；在没有重写equals的方法情况下，equals与==比较结果相同，都是对引用地址的比较；基础数据类型都重写了equals方法，拿string类来说，它重写了object的equals方法

但是要将自定义的元素add进HashSet中，则必须定义其自己的hashcode()方法和equals（）方法。
如下所示：（自定义Person类对象）

package com.package2;
import java.util.*;
public class HashSet3 
{
	public static void main(String[] args) 
	{
		HashSet hs = new HashSet();
 
		hs.add(new Person("a1",11));
		hs.add(new Person("a2",12));
		hs.add(new Person("a3",13));
		hs.add(new Person("a2",12));
		hs.add(new Person("a4",14));
		
		Iterator it = hs.iterator();
		/*迭代器：轻量级对象（创建代价小，只能单向移动），工作时遍历并选择序列中的对象
			4个方法：
			1.使用iterator()来返回一个Iterator。
			2.使用Object next()获得集合中的下一个元素。
			3.使用boolean hasNext()检查集合中是否还有元素(判断集合里是否存在下一个元素)。
			4.使用remove()将迭代器新近返回的元素删除。（删除集合里上一次next方法返回的元素）*/
 
		while(it.hasNext())
		{
			Person p = (Person)it.next();
			System.out.println(p.getName()+"::"+p.getAge());
		}
	}
}
class Person
{
	private String name;
	private int age;
	Person(String name,int age)
	{
		this.name = name;
		this.age = age;
	}
	
	public int hashCode()
	{
		System.out.println(this.name+"....hashCode");
		return name.hashCode()+age*37;  //保证此元素的返回值尽量不一致。
	}

	public boolean equals(Object obj)
	{
 
		if(!(obj instanceof Person)) //instanceof用来判断一个对象是不是一个类的实例
		
			return false;
 
		Person p = (Person)obj;
		System.out.println(this.name+"...equals.."+p.name);
 
		return this.name.equals(p.name) && this.age == p.age;
		//this.name 是String类型，而String类重写了equals方法，比较的是字符串的内容，不再是地址值。
		//这里其实就是比较名字和年龄是否相同
	}
 
	
	public String getName()
	{
		return name;
	}
	public int getAge()
	{
		return age;
	}
}

HashSet查找原理如下：

基于HashSet以上的存储原理，在查找元素时，HashSet先计算元素的HashCode值（也就是调用对象的hashCode方法的返回值），然后直接到hashCode值对应的位置去取出元素即可，这就是HashSet速度很快的原因。

LinkedHashSet类

LinkedHashSet是HashSet的一个子类，具有HashSet的特性，也是根据元素的hashCode值来决定元素的存储位置。但它使用链表维护元素的次序，元素的顺序与添加顺序一致。由于LinkedHashSet需要维护元素的插入顺序，因此性能略低于HashSet，但在迭代访问Set里的全部元素时由很好的性能。

TreeSet

可以对Set集合中的元素进行排序。
底层数据结构是二叉树。
保证元素唯一性的依据：compareTo方法return 0

TreeSet支持两种排序方法：自然排序和定制排序，默认采用自然排序。

自然排序

让元素自身具备比较性

TreeSet会调用集合元素的 compareTo(Object obj) 方法来比较元素的大小关系，然后将元素按照升序排列，这就是自然排序。

如果试图将一个对象添加到TreeSet集合中，则该对象必须实现Comparable接口，并且覆盖compareTo方法

当一个对象调用方法与另一个对象比较时，例如obj1.compareTo(obj2)，如果该方法返回0，则两个对象相等；如果返回一个正数，则obj1大于obj2；如果返回一个负数，则obj1小于obj2。

Comparable接口:该接口对实现它的每个类的对象强加一个整体排序。 这个排序被称为类的自然排序 ，类的compareTo方法被称为其自然比较方法 。

Java常用类中已经实现了Comparable接口的类有以下几个：

♦ BigDecimal、BigDecimal以及所有数值型对应的包装类：按照它们对应的数值大小进行比较。

♦ Charchter：按照字符的unicode值进行比较。

♦ Boolean：true对应的包装类实例大于false对应的包装类实例。

♦ String：按照字符串中的字符的unicode值进行比较。

♦ Date、Time：后面的时间、日期比前面的时间、日期大。

对于TreeSet集合而言，它判断两个对象是否相等的标准是：两个对象通过compareTo(Object obj)方法比较是否返回0，如果返回0则相等。

String就不做举例，大家都知道String类已经实现该接口，如果我们要往TreeSet里添加的元素是自己刚刚定义的，我们也可以自己定义该元素的类实现Comparable接口，并且覆盖compareTo（）方法：

package com.package1;
 
import java.util.*;
 
class Student implements Comparable//该接口强制让学生具备比较性。
{
	private String name;
	private int age;
 
	Student(String name,int age)
	{
		this.name = name;
		this.age = age;
	}
 
	public int compareTo(Object obj)
	{
 
		//return 0;
		
		if(!(obj instanceof Student))
			throw new RuntimeException("不是学生对象");
		Student s = (Student)obj;
 
		//System.out.println(this.name+"....compareto....."+s.name);
		if(this.age>s.age)
			return 1;
		if(this.age==s.age)
		{
			return this.name.compareTo(s.name);
		}
		return -1;
		/**/
	}
	public String getName()
	{
		return name;
	}
	public int getAge()
	{
		return age;
	}
}
public class TreeSet2 
{
	public static void main(String[] args) 
	{
		TreeSet ts = new TreeSet();
		ts.add(new Student("lisi02",22));
		ts.add(new Student("lisi02",21));
		ts.add(new Student("lisi007",20));
		ts.add(new Student("lisi09",19));
		ts.add(new Student("lisi06",18));
		ts.add(new Student("lisi06",18));
		ts.add(new Student("lisi007",29));
		Iterator it = ts.iterator();
		while(it.hasNext())
		{
			Student stu = (Student)it.next();
			System.out.println(stu.getName()+"..."+stu.getAge());
		}
	}
}

定制排序

当元素自身不具备比较性时，或者具备的比较性不是所需要的。这时就需要让集合自身具备比较性（即利用其另一种构造函数建立对象）。在集合初始化时，就有了比较方式。

想要实现定制排序，需要在创建TreeSet集合对象时，提供一个Comparator对象与该TreeSet集合关联，由Comparator对象负责集合元素的排序逻辑。

也就是说：利用某个指定类实现Comparator接口，并且重写compare（）方法，则此类会成为一个具备比较方法的类（自己创建一个比较器）。在建立TreeSet的时候，将此类对象传入其中。则此时，添加进TreeSet中的元素可按照指定比较方法进行排序。

Comparator比较器接口：比较功能，对一些对象的集合施加了一个整体排序 。

/*
 * 使元素按照长度来排序，若长度相同，则按照自然排序。
 */
public class TreeSettest {
 
	public static void main(String[] args) {
		//创建对象
		TreeSet ts=new TreeSet(new MyCompare());
		
		//添加元素
		ts.add("abc");
		ts.add("bcc");
		ts.add("das");
		ts.add("bcde");
		ts.add("asdfg");
		ts.add("befqfca");
		
		//进行迭代
		Iterator it=ts.iterator();
		
		//循环取出元素
		while(it.hasNext())
		{
			System.out.println(it.next());
		}
 
	}
 
}
 
//定义一个类实现Comparator接口，并且覆盖compare（）方法。
class MyCompare implements Comparator
{
 
	@Override
	public int compare(Object o1, Object o2) {
		//进行强制类型转换
		String s1=(String) o1;
		String s2=(String) o2;
		
		//进行比较
		if(s1.length()>s2.length())
			return 1;
		if(s1.length()<s2.length())
			return -1;
		if(s1.length()==s2.length())
		{
			return s1.compareTo(s2);
		}
		return 0;
	}
}

综上：自然排序实现的是Comparable接口，定制排序实现的是Comparator接口。

EnumSet类

EnumSet是一个专为枚举类设计的集合类，不允许添加null值。EnumSet的集合元素也是有序的，它以枚举值在Enum类内的定义顺序来决定集合元素的顺序。

各Set实现类的性能分析

HashSet的性能比TreeSet的性能好（特别是添加，查询元素时），因为TreeSet需要额外的红黑树算法维护元素的次序，如果需要一个保持排序的Set时才用TreeSet，否则应该使用HashSet。

LinkedHashSet是HashSet的子类，由于需要链表维护元素的顺序，所以插入和删除操作比HashSet要慢，但遍历比HashSet快。

EnumSet是所有Set实现类中性能最好的，但它只能保存同一个枚举类的枚举值作为集合元素。

以上几个Set实现类都是线程不安全的，如果多线程访问，必须手动保证集合的同步性

List

这个集合主要在于了解它所具有方法就好：推荐   https://blog.csdn.net/Barcon/article/details/82628120

List集合代表一个有序、可重复集合，集合中每个元素都有其对应的顺序索引。List集合默认按照元素的添加顺序设置元素的索引，可以通过索引（类似数组的下标）来访问指定位置的集合元素。

实现List接口的集合主要有：ArrayList、LinkedList、Vector、Stack。

ArrayList

ArrayList是一个动态数组，也是我们最常用的集合，是List类的典型实现。

它允许任何符合规则的元素插入甚至包括null。

每一个ArrayList都有一个初始容量（10），该容量代表了数组的大小。随着容器中的元素不断增加，容器的大小也会随着增加。在每次向容器中增加元素的同时都会进行容量检查，当快溢出时，就会进行扩容操作（1.5倍）。所以如果我们明确所插入元素的多少，最好指定一个初始容量值，避免过多的进行扩容操作而浪费时间、效率。

ArrayList擅长查询，但是增删稍慢。同时ArrayList是非同步的。

LinkedList

LinkedList是List接口的另一个实现，除了可以根据索引访问集合元素外，LinkedList还实现了Deque接口，可以当作双端队列来使用，也就是说，既可以当作“栈”使用，又可以当作队列使用。

LinkedList内部以链表的形式保存集合中的元素，所以查询集合中的元素性能较差，但在插入删除元素时有较好的性能。

线程不同步

Vector

与ArrayList相似，但是Vector是同步的。所以说Vector是线程安全的动态数组。它的操作与ArrayList几乎一样。

有一点不一样：扩容是原来的2倍

但是被替代，效率低

Stack

Stack继承自Vector，实现一个后进先出的堆栈。

Stack提供5个额外的方法使得Vector得以被当作堆栈使用。

基本的push和pop 方法，还有peek方法得到栈顶的元素，empty方法测试堆栈是否为空，search方法检测一个元素在堆栈中的位置。

Stack刚创建后是空栈。

ListIterator接口

ListIterator接口继承Iterator接口，提供了专门操作List的方法。ListIterator接口在Iterator接口的基础上增加了以下几个方法：

boolean hasPrevious()：判断集合里是否存在上一个元素。如果有，该方法返回 true。
Object
previous()：返回集合里上一个元素。
void add(Object o)：在指定位置插入一个元素。

两个接口相比较，不难发现，ListIterator增加了向前迭代的功能（Iterator只能向后迭代），ListIterator还可以通过add()方法向List集合中添加元素（Iterator只能删除元素）。

在迭代时，不可以通过集合对象的方法操作集合中的元素。因为会发生ConcurrentModificationException异常。
所以，在迭代器时，只能用迭代器自有的方法操作元素

Map

Map接口采用键值对Map<K,V>的存储方式，保存具有映射关系的数据，因此，Map集合里保存两组值，一组值用于保存Map里的key，另外一组值用于保存Map里的value，key和value可以是任意引用类型的数据。 **key值不允许重复，可以为null。**如果添加key-value对时Map中已经有重复的key，则新添加的value会覆盖该key原来对应的value。常用实现类有HashMap、LinkedHashMap、TreeMap等。

Map集合的两种取出方式：

1，Set < k> keySet：将map中所有的键存入到Set集合。因为Set具备迭代器。
所有可以迭代方式取出所有的键，在根据get方法。获取每一个键对应的值。

Map集合的取出原理：将map集合转成set集合。在通过迭代器取出。

2，Set<Map.Entry<k,v>> entrySet：将map集合中的映射关系存入到了set集合中，
而这个关系的数据类型就是：Map.Entry

实现步骤：

1，调用Map集合中的entrySet()方法，将集合中的映射关系对象存储到Set集合中

2，迭代Set集合

3，获取Set集合的元素，是映射关系的对象

4，通过映射关系对象的方法，getKey()和getValue(),获取键值对

Entry其实就是Map中的一个static内部接口。 entry将键值对的对应关系封装成了对象，即键值对对象

为什么要定义在内部呢？
因为只有有了Map集合，有了键值对，才会有键值的映射关系。关系属于Map集合中的一个内部事物。而且该事物在直接访问Map集合中的元素。

HashMap与Hashtable：

HashMap与Hashtable是Map接口的两个典型实现，它们之间的关系完全类似于ArrayList与Vertor。HashTable是一个古老的Map实现类，它提供的方法比较繁琐，目前基本不用了。

1. HashMap与Hashtable主要存在以下典型区别：

HashMap是线程不安全，HashTable是线程安全的。
HashMap可以使用null值作为key或value；Hashtable不允许使用null值作为key和value，如果把null放进HashTable中，将会发生空指针异常。
Hashtable继承自Dictionary类，而HashMap继承自AbstractMap类。但二者都实现了Map接口。
内部实现使用的数组初始化和扩容方式不同
HashTable直接使用对象的hashCode。而HashMap重新计算hash值。

为了成功的在HashMap和Hashtable中存储和获取对象，用作key的对象必须实现hashCode()方法和equals()方法。

HashMap工作原理如下：（1.7） O（n）

HashMap基于hashing原理，通过put()和get()方法存储和获取对象。

当我们将键值对传递给put()方法时，它调用key对象的hashCode()方法来计算hashCode值，然后使用indexFor方法找到bucket位置来储存值对象。如果该位置没有对象存在，就将此对象直接放进数组当中；如果该位置已经有对象存在了，则顺着此存在的对象的链开始寻找(为了判断是否是否值相同，map不允许），判断当前数组中处理hash冲突的方式为链表还是红黑树(check第一个节点类型即可),分别处理
　　
　　get(key)方法时获取key的hash值，计算hash&(n-1)得到在链表数组中的位置first=tab[hash&(n-1)],先判断first的key是否与参数key相等equals()方法，不等就遍历后面的链表找到相同的key值返回对应的Value值即可

HashMap使用链表来解决碰撞问题，当发生碰撞了**，新值存放在数组中，旧值在新值的链表上。**

indexFor方法: 如何找寻对应的数组下标：

static int indexFor(int h, int length) {
        return h & (length-1);//length=2 的整数次幂
    }

这里哈希值与上(length-1)，length=传入的容量是16的话，16-1=15，二进制1111，即对h取低四位，从而对应0-15个位桶
即无论我们指定的容量为多少，构造方法都会将实际容量设为不小于指定容量的2的次方的一个数，且最大值不能超过2的30次方

JDK1.8 O(logn)

JDK8中采用的是位桶+链表/红黑树的方式，也是非线程安全的。当某个位桶的链表的长度达到某个阀值的时候，这个链表就将转换成红黑树。

JDK8中，当同一个hash值的节点数不小于8时，将不再以单链表的形式存储了，会被调整成一颗红黑树。这就是JDK7与JDK8中HashMap实现的最大区别。

JDK中Entry的名字变成了Node，原因是和红黑树的实现TreeNode相关联。

具体源码实现请参考：https://blog.csdn.net/hefenglian/article/details/79763634

HashMap加载因子

主要是就：为了减少冲突的概率，不要让链表过长，减少查询成本

Hashtable 初始容量是11 ，扩容方式为2N+1;

HashMap 初始容量是16,扩容方式为2N;

提高空间利用率和减少查询成本的折中，主要是泊松分布，0.75的话碰撞最小，

HashMap有两个参数影响其性能：初始容量和加载因子。容量是哈希表中桶的数量，初始容量只是哈希表在创建时的容量。加载因子是哈希表在其容量自动扩容之前可以达到多满的一种度量。当哈希表中的条目数超出了加载因子与当前容量的乘积时，则要对该哈希表进行扩容、rehash操作（即重建内部数据结构），扩容后的哈希表将具有两倍的原容量。

通常，加载因子需要在时间和空间成本上寻求一种折衷。

2. LinkedHashMap实现类

LinkedHashMap使用双向链表来维护key-value对的次序（其实只需要考虑key的次序即可），该链表负责维护Map的迭代顺序，与插入顺序一致，因此性能比HashMap低，但在迭代访问Map里的全部元素时有较好的性能。

3. Properties

Properties类是Hashtable类的子类，它相当于一个key、value都是String类型的Map，主要用于读取配置文件。

4. TreeMap实现类

TreeMap是SortedMap的实现类，是一个红黑树的数据结构，每个key-value对作为红黑树的一个节点。TreeMap存储key-value对时，需要根据key对节点进行排序。TreeMap也有两种排序方式：

♦ 自然排序：TreeMap的所有key必须实现Comparable接口，而且所有的key应该是同一个类的对象，否则会抛出ClassCastException。

♦ 定制排序：创建TreeMap时，传入一个Comparator对象，该对象负责对TreeMap中的所有key进行排序。

各Map实现类的性能分析

♦ HashMap通常比Hashtable（古老的线程安全的集合）要快

♦ TreeMap通常比HashMap、Hashtable要慢，因为TreeMap底层采用红黑树来管理key-value。

♦ LinkedHashMap比HashMap慢一点，因为它需要维护链表来保存key-value的插入顺序。

代码实例：

package com.package1;
/*
 * 功能：获取一个字符串“abababcgh”中各个字母出现的次数，并且打印
 * 方式：利用TreeMap实现。
 */
import java.util.*;
import java.util.Map.Entry;
 
public class MapDemo2 {
 
	public static void main(String[] args) {
		
		String s="sfcnewjgwfvskfksdjfjsakdjjjjj";
		Getnum(s);
 
	}
	
	public static void Getnum(String s)
	{
		char[] a=s.toCharArray();
		
		TreeMap<Character,Integer> tm=new TreeMap<Character,Integer>();
		
		//根据数组中的元素，循环查找集合中是否存在
		for(int i=0;i<a.length;i++)
		{
			Integer values=tm.get(a[i]);
			
			//判断values的值
			if(values==null)
			{
				//将数组中的值put到集合中
				tm.put(a[i], 1);
			}
			else
			{
				values=values+1;
				tm.put(a[i], values);
				
			}			
		}
		System.out.println(tm);
		
		//取出数据
        //取出方式1：keySet();
		Set<Character> ks=tm.keySet();
		Iterator<Character> it=ks.iterator();
		
		while(it.hasNext())
		{
			Character key=it.next();    //得到K
			Integer in=tm.get(key);     //根据K取出value
			
			System.out.println(key+"("+in+")");
		}
	
		//方式2：entrySet();
		Set<Map.Entry<Character,Integer>> es =tm.entrySet();
		Iterator<Map.Entry<Character, Integer>> it=es.iterator();

		//循环取出
		while(it.hasNext())
		{
			//me为映射关系
			Entry<Character, Integer> me=it.next();
			//根据映射关系取出K-V
			Character c=me.getKey();
			Integer in=me.getValue();
			
			System.out.println(c+"("+in+")");
			
		}
	}
}

面试官提问

1）介绍HashMap：
按照特性来说明一下：储存的是键值对，线程不安全，非Synchronied，储存的比较快，能够接受null。

按照工作原理来叙述一下：Map的put（key，value）来储存元素，通过get（key）来得到value值，通过hash算法来计算hascode值，用hashCode标识Entry在bucket中存储的位置，储存结构就算哈希表。

“2）你知道HashMap的工作原理吗？” “你知道HashMap的get()方法的工作原理吗？”
“HashMap是基于hashing的原理，我们使用put(key, value)存储对象到HashMap中，使用get(key)从HashMap中获取对象。
当我们给put()方法传递键和值时，我们先对键调用hashCode()方法，返回的hashCode用于找到bucket位置来储存Entry对象。

”这里关键点在于指出，HashMap是在bucket中储存键对象和值对象，作为Map.Entry。
这一点有助于理解获取对象的逻辑。如果你没有意识到这一点，或者错误的认为仅仅只在bucket中存储值的话，你将不会回答如何从HashMap中获取对象的逻辑。这个答案相当的正确，也显示出面试者确实知道hashing以及HashMap的工作原理。

3）提问：两个hashcode相同的时候会发生说明？

hashcode相同，bucket的位置会相同，也就是说会发生碰撞，哈希表中的结构其实有链表（LinkedList），这种冲突通过将元素储存到LinkedList中，解决碰撞。储存顺序是放在表头。

4）如果两个键的hashcode相同，如何获取值对象？

如果两个键的hashcode相同，即找到bucket位置之后，我们通过key.equals（）找到链表LinkedList中正确的节点，最终找到要找的值对象。

一些优秀的开发者会指出使用不可变的、声明作final的对象，并且采用合适的equals()和hashCode()方法的话，将会减少碰撞的发生，提高效率。不可变性使得能够缓存不同键的hashcode，这将提高整个获取对象的速度，使用String，Interger这样的wrapper类作为键是非常好的选择。

5）如果HashMap的大小超过了负载因子(load factor)定义的容量？怎么办？

HashMap里面默认的负载因子大小为0.75，也就是说，当一个map填满了75%的bucket时候，和其它集合类(如ArrayList等)一样，将会创建原来HashMap大小的两倍的bucket数组，来重新调整map的大小，并将原来的对象放入新的bucket数组中。这个过程叫作rehashing，因为它调用hash方法找到新的bucket位置。

6）重新调整HashMap大小的话会出现什么问题？

多线程情况下会出现竞争问题，因为你在调节的时候，LinkedList储存是按照顺序储存，调节的时候回将原来最先储存的元素（也就是最下面的）遍历，多线程就好试图重新调整，这个时候就会出现死循环。

当多线程的情况下，可能产生条件竞争(race condition)。

当重新调整HashMap大小的时候，确实存在条件竞争，因为如果两个线程都发现HashMap需要重新调整大小了，它们会同时试着调整大小。在调整大小的过程中，存储在链表中的元素的次序会反过来，因为移动到新的bucket位置的时候，HashMap并不会将元素放在链表的尾部，而是放在头部，这是为了避免尾部遍历(tail traversing)。如果条件竞争发生了，那么就死循环了。

7）HashMap在并发执行put操作，会引起死循环，为什么？
是因为多线程会导致hashmap的node链表形成环形链表，一旦形成环形链表，node 的next节点永远不为空，就会产生死循环获取node。从而导致CPU利用率接近100%。

8）为什么String, Interger这样的wrapper类适合作为键？
因为他们一般不是不可变的，源码上面final，使用不可变类，而且重写了equals和hashcode方法，避免了键值对改写。提高HashMap性能。

String, Interger这样的wrapper类作为HashMap的键是再适合不过了，而且String最为常用。因为String是不可变的，也是final的，而且已经重写了equals()和hashCode()方法了。其他的wrapper类也有这个特点。不可变性是必要的，因为为了要计算hashCode()，就要防止键值改变，如果键值在放入时和获取时返回不同的hashcode的话，那么就不能从HashMap中找到你想要的对象。不可变性还有其他的优点如线程安全。如果你可以仅仅通过将某个field声明成final就能保证hashCode是不变的，那么请这么做吧。因为获取对象的时候要用到equals()和hashCode()方法，那么键对象正确的重写这两个方法是非常重要的。如果两个不相等的对象返回不同的hashcode的话，那么碰撞的几率就会小些，这样就能提高HashMap的性能。

9）使用CocurrentHashMap代替Hashtable？
可以，但是Hashtable提供的线程更加安全。
Hashtable是synchronized的，但是ConcurrentHashMap同步性能更好，因为它仅仅根据同步级别对map的一部分进行上锁。ConcurrentHashMap当然可以代替HashTable，但是HashTable提供更强的线程安全性。

10）hashing的概念
散列法（Hashing）或哈希法是一种将字符组成的字符串转换为固定长度（一般是更短长度）的数值或索引值的方法，称为散列法，也叫哈希法。由于通过更短的哈希值比用原始值进行数据库搜索更快，这种方法一般用来在数据库中建立索引并进行搜索，同时还用在各种解密算法中。

参考链接：
https://blog.csdn.net/qq_25827845/article/details/51287142
https://www.cnblogs.com/bingyimeiling/p/10255037.html
https://blog.csdn.net/hefenglian/article/details/79763634

冰の樱

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
JAVA集合框架--Set/Map/List

JAVAHashSet保证元素唯一性当向HashSet集合存储一个元素时：HashSet会调用该对象的hashCode()方法得到其hashCode值，然后根据hashCode值决定该对象的存储位置。HashSet集合判断两个元素相等的标准是：(1)两个对象通过equals()方法比较返回true；(2)两个对象的hashCode()方法返回值相等。因此，如果(1)和(2)有一个不满足条件，则认为这两个对象不相等，可以添加成功。如果两个对象的hashCode()方法返回值相等，但是两个对象通过
复制链接

扫一扫