Map和Set
1.概念
Map和set是一种专门用来进行搜索的容器或者数据结构,其搜索的效率与其具体的实例化子类有关。以前常见的
搜索方式有:
- 直接遍历,时间复杂度为O(N),元素如果比较多效率会非常慢
- 二分查找,时间复杂度为
,但搜索前必须要求序列是有序的
上述排序比较适合静态类型的查找,即一般不会对区间进行插入和删除操作了,而现实中的查找比如: - 根据姓名查询考试成绩
- 通讯录,即根据姓名查询联系方式
- 不重复集合,即需要先搜索关键字是否已经在集合中
可能在查找时进行一些插入和删除的操作,即动态查找,那上述两种方式就不太适合了,本节介绍的Map和Set是
一种适合动态查找的集合容器
重要的概念:
1.一般把搜索的数据称为关键字(Key),和关键字对应的称为值(Value),将其称之为Key-value的键值对 - 纯 key 模型,比如:
有一个英文词典,快速查找一个单词是否在词典中
快速查找某个名字在不在通讯录中 - Key-Value 模型,比如:
统计文件中每个单词出现的次数,统计结果是每个单词都有与其对应的次数:<单词,单词出现的次数>
梁山好汉的江湖绰号:每个好汉都有自己的江湖绰号
而Map中存储的就是key-value的键值对,Set中只存储了Key。
2.Map
Map是一个接口类,该类没有继承自Collection,该类中存储的是<K,V>结构的键值对,并且K一定是唯一的,不
能重复
2.1 Map.Entry<K, V>
Map.Entry<K, V> 是Map内部实现的用来存放<key, value>键值对映射关系的内部类,该内部类中主要提供了
<key, value>的获取,value的设置以及Key的比较方式
方法 :
方法 | 解释 |
---|---|
K getKey() | 返回 entry 中的 key |
V getValue() | 返回 entry 中的 value |
V setValue(V value) | 将键值对中的value替换为指定value |
2.2 Map的常用方法
方法 | 解释 |
---|---|
V get(Object key) | 返回 key 对应的 value |
V getOrDefault(Object key, V defaultValue) | 返回 key 对应的 value,key 不存在,返回默认值 |
V put(K key, V value) | 设置 key 对应的 value |
V remove(Object key) | 删除 key 对应的映射关系 |
Set keySet() | 返回所有 key 的不重复集合 |
Collection values() | 返回所有 value 的可重复集合 |
Set<Map.Entry<K, V>> entrySet() | 返回所有的 key-value 映射关系 |
boolean containsKey(Object key) | 判断是否包含 key |
boolean containsValue(Object value) | 判断是否包含 value |
注意:
- Map是一个接口,不能直接实例化对象,如果要实例化对象只能实例化其实现类TreeMap或者HashMap
- Map中存放键值对的Key是唯一的,value是可以重复的
- 在Map中插入键值对时,key不能为空,否则就会抛NullPointerException异常,但是value可以为空
- Map中的Key可以全部分离出来,存储到Set中来进行访问(因为Key不能重复)。
- Map中的value可以全部分离出来,存储在Collection的任何一个子集合中(value可能有重复)。
- Map中键值对的Key不能直接修改,value可以修改,如果要修改key,只能先将该key删除掉,然后再来进行
重新插入。 - TreeMap和HashMap的区别
Map底层结构 | TreeMap | HashMap |
---|---|---|
底层结构 | 红黑树 | 哈希桶 |
插入/删除/查找时间复杂度 | O ( l o g 2 N ) O(log_{2}N) O(log2N) | O(1) |
是否有序 | 关于Key有序 | 无序 |
线程安全 | 不安全 | 不安全 |
插入/删除/查找区别 | 需要进行元素比较 | 通过哈希函数计算哈希地址 |
比较与覆写 | key必须能够比较,否则会抛出ClassCastException异常 | 自定义类型需要覆写equals和hashCode方法 |
应用场景 | 需要Key有序场景下 | Key是否有序不关心,需要更高的时间性能 |
3.Set
Set与Map主要的不同有两点:Set是继承自Collection的接口类,Set中只存储了Key
3.1Set的常见方法说明
方法 | 解释 |
---|---|
boolean add(E e) | 添加元素,但重复元素不会被添加成功 |
void clear() | 清空集合 |
boolean contains(Object o) | 判断 o 是否在集合中 |
Iterator iterator() | 返回迭代器 |
boolean remove(Object o) | 删除集合中的 o |
int size() | 返回set中元素的个数 |
boolean isEmpty() | 检测set是否为空,空返回true,否则返回false |
Object[] toArray() | 将set中的元素转换为数组返回 |
boolean containsAll(Collection<?> c) | 集合c中的元素是否在set中全部存在,是返回true,否则返回false |
boolean addAll(Collection<? extends E> c) | 将集合c中的元素添加到set中,可以达到去重的效果 |
注意:
- Set是继承自Collection的一个接口类
- Set中只存储了key,并且要求key一定要唯一
- Set的底层是使用Map来实现的,其使用key与Object的一个默认对象作为键值对插入到Map中的
- Set最大的功能就是对集合中的元素进行去重
- 实现Set接口的常用类有TreeSet和HashSet,还有一个LinkedHashSet,LinkedHashSet是在HashSet的基础
上维护了一个双向链表来记录元素的插入次序。 - Set中的Key不能修改,如果要修改,先将原来的删除掉,然后再重新插入
- Set中不能插入null的key。
- TreeSet和HashSet的区别
Set底层结构 | TreeSet | HashSet |
---|---|---|
底层结构 | 红黑树 | 哈希桶 |
插入/删除/查找时间复杂度 | $ O(log_2N)$ | O(1) |
是否有序 | 关于Key有序 | 不一定有序 |
线程安全 | 不安全 | 不安全 |
插入/删除/查找区别 | 按照红黑树的特性来进行插入和删除 | 1. 先计算key哈希地址 2. 然后进行插入和删除 |
比较与覆写 | key必须能够比较,否则会抛出ClassCastException异常 | 自定义类型需要覆写equalshashCode方法 |
应用场景 | 需要Key有序场景下 | Key是否有序不关心,需要更高的时间性能 |
4. 面试题练习
4.1只出现一次的数字
题目:
给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。
说明:
你的算法应该具有线性时间复杂度。 你可以不使用额外空间来实现吗?
来源:力扣(LeetCode)
链接:只出现一次的数字
分析:
这个数组中只有一个元素出现了一次,其余元素都出现了2次
因此可以用Set的性质,遍历数组
遇到set中没有的元素就添加到set中,若已有此元素,则删除set中已有的元素
代码示例
class Solution {
public int singleNumber(int[] nums) {
HashSet<Integer> set = new HashSet<>();
for(int tmp:nums){
if(!set.contains(tmp)){
set.add(tmp);
}else{
set.remove(tmp);
}
}
int a=0;
for(int b:set){
a=b;
}
return a;
}
}
4.2 复制带随机指针的链表
题目:
复制带随机指针的链表
分析
题目给定的是一个头节点,链表给的节点由两个指向,一个指向next而另一个指向random,
想要复制整个链表,需要借助HashMap将每个节点进行村春原节点映射为新的节点,
Map中存储原节点和新节点,每个原节点都对应一个新节点,
通过遍历链表来访问Map将新节点链接起来,即可完成复制
代码示例:
class Solution {
public Node copyRandomList(Node head) {
if(head==null)return null;
Map<Node,Node> map=new HashMap<>();
Node cur =head;
while(cur!=null){
Node subcur=new Node(cur.val);
map.put(cur,subcur);
cur=cur.next;
}
cur=head;
while(cur!=null){
map.get(cur).next=map.get(cur.next);
map.get(cur).random=map.get(cur.random);
cur=cur.next;
}
return map.get(head);
}
}
4.3 宝石与石头
题目
宝石与石头
分析:
给定宝石字符串和自己拥有的石头字符串,需要统计出石头字符串中和宝石字符串中相同字符的个数
此题只需要遍历石头字符串,如果当前字符也存在于宝石字符串当中,那么自己含有的宝石数量就+1
利用Set的性质
代码示例
class Solution {
public int numJewelsInStones(String jewels, String stones) {
Set<Character> set=new HashSet<>();
for(int i=0;i<jewels.length();i++){
char q=jewels.charAt(i);
set.add(q);
}
int count=0;
for(int i=0;i<stones.length();i++){
char p=stones.charAt(i);
if(set.contains(p)){
count++;
}
}
return count;
}
}
4.4 旧键盘打字
题目
旧键盘打字
旧键盘上坏了几个键,于是在敲一段文字的时候,对应的字符就不会出现。现在给出应该输入的一段文字、以及实际被输入的文字,请你列出肯定坏掉的那些键
输入描述:
输入在2行中分别给出应该输入的文字、以及实际被输入的文字。每段文字是不超过80个字符的串,由字母A-Z(包括大、小写)、数字0-9、以及下划线“_”(代表空格)组成。题目保证2个字符串均非空。
输出描述:
按照发现顺序,在一行中输出坏掉的键。其中英文字母只输出大写,每个坏键只输出一次。题目保证至少有1个坏键。
分析
题目指出在打印一段文字时坏掉的字符没有出现,
给定实际输入的文字,列出坏掉的键
利用Set1保存期望输入的键,Set2保存实际输入的键即可
遍历期望输入的键,当实际输入的键中保存了已有的键就将其移除Set1,最终Set1中剩下的键就是坏掉的键
代码示例
import java.util.*;
public class Main {
public static void function(String strExc,String strAct){
//
HashSet<Character> setAct = new HashSet<>();
for(char ch : strAct.toUpperCase().toCharArray()) {
setAct.add(ch);
}
HashSet<Character> setBroken = new HashSet<>();
HashSet<Character> set = new HashSet<>();
//setAct就存储了 我实际输入的数据
//遍历strExc 看哪个键不在setAct集合当中
for(char ch : strExc.toUpperCase().toCharArray()) {
if(!setAct.contains(ch)&&!set.contains(ch) ) {
//1、把他放到集合 2、
set.add(ch);
System.out.print(ch);
}
}
}
public static void main(String[] args) {
Scanner scan = new Scanner(System.in);
String strExc = scan.nextLine();//期望输入的
String strAct = scan.nextLine();//实际输入的
function(strExc,strAct);
}
}