一、今日刷题
1. 第六部分:哈希表 – 242. 有效的字母异位词
给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。
注意:若 s 和 t 中每个字符出现的次数都相同,则称 s 和 t 互为字母异位词。
进阶: 如果输入字符串包含 unicode 字符怎么办?你能否调整你的解法来应对这种情况?
示例 1:
输入: s = “anagram”, t = “nagaram”
输出: true
示例 2:
输入: s = “rat”, t = “car”
输出: false
答案代码:
package HashSet;
import java.util.HashMap;
/**
* @author: LYZ
* @date: 2022/2/10 19:46
* @description: 242.给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。
*
* 注意:若s 和 t中每个字符出现的次数都相同,则称s 和 t互为字母异位词。
*/
public class IsAnagram {
public static void main(String[] args) {
IsAnagram isAnagram = new IsAnagram();
Boolean ans = isAnagram.isAnagram("asthh", "sahh");
System.out.println(ans);
}
public boolean isAnagram(String s, String t) {
HashMap<Character, Integer> hashMap = new HashMap<>();
if (s.length() != t.length()) {
return false;
}
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
int frequencyS = hashMap.getOrDefault(c, 0);
hashMap.put(c, frequencyS + 1);
}
for (int j = 0; j < t.length(); j++) {
char c = t.charAt(j);
int frequencyT = hashMap.getOrDefault(c, 0);
hashMap.put(c, frequencyT - 1);
if (hashMap.get(c) < 0) {
return false;
}
}
return true;
}
}
二、总结
1.HashMap的一些方法:
HashMap 是一个散列表,它存储的内容是键值对(key-value)映射。
实现了 Map 接口,根据键的 HashCode 值存储数据,具有很快的访问速度,最多允许一条记录的键为 null,不支持线程同步。
是无序的,即不会记录插入的顺序。
①创建 HashMap 对象:
HashMap<Character, Integer> hashMap = new HashMap<>();
②添加元素 put()方法:
hashMap.put('a', 1);
③访问元素 get()方法:
使用 get(key) 方法来获取 key 对应的 value
hashMap.get('a');
④删除元素 remove()方法:
使用 remove(key) 方法来删除 key 对应的键值对(key-value)
hashMap.remove('a');
⑤获取键值对个数:
hashMap.size();
⑥getOrDefault():
获取指定 key 对应对 value,如果找不到 key ,则返回设置的默认值
2.什么是Unicode(编码标准)?
Unicode是一种字符编码标准,在不同领域的IT中都很常用。 Unicode是国际标准,于1987年创建,是ASCII和其他字符集的替代方法。 截至2020年3月,Unicode字符集版本为13.0,其中包含来自不同语言和字母的143,859个字符。 当前,Unicode字符集包含154种带有设置和表情符号的现代字母。
Unicode标准包含多种不同大小的编码格式,例如UTF-8,UTF-16,UTF-32。
Ununicode标准支持不同的表情符号,它们在当今的文本消息和聊天应用程序中广泛使用。 这些unicode表情符号也用于网站和论坛中的评论和普通文本,不同的表情符号和相关的unicode值。
在本题进阶需求中,Unicode 是为了解决传统字符编码的局限性而产生的方案,它为每个语言中的字符规定了一个唯一的二进制编码。而Unicode 中可能存在一个字符对应多个字节的问题,为了让计算机知道多少字节表示一个字符,面向传输的编码方式的 UTF−8 和UTF-16也随之诞生逐渐广泛使用,进阶问题的核心点在于「字符是离散未知的」,不再是理想中的26个字母,等等…因此我们用哈希表维护对应字符的频次。同时读者需要注意 Unicode 一个字符可能对应多个字节的问题,不同语言对于字符串读取处理的方式是不同的。