排序题目：有效的字母异位词

最新推荐文章于 2024-09-05 18:00:00 发布

伟大的车尔尼

最新推荐文章于 2024-09-05 18:00:00 发布

阅读量842

点赞数 15

分类专栏：数据结构和算法 # 排序文章标签：排序

本文链接：https://blog.csdn.net/stormsunshine/article/details/125451452

版权

数据结构和算法同时被 2 个专栏收录

348 篇文章 9 订阅

订阅专栏

排序

43 篇文章 0 订阅

订阅专栏

题目

标题和出处

标题：有效的字母异位词

出处：242. 有效的字母异位词

难度

2 级

题目描述

要求

给定两个字符串 $\texttt{s}$ 和 $\texttt{t}$ ，如果 $\texttt{t}$ 是 $\texttt{s}$ 的字母异位词则返回 $\texttt{true}$ ，否则返回 $\texttt{false}$ 。

字母异位词是将另一个单词或词组的字母重新排列之后得到的单词或词组，原始单词或词组中的每个字母恰好使用一次。

示例

示例 1：

输入： $\texttt{s = "anagram", t = "nagaram"}$
输出： $\texttt{true}$

示例 2：

输入： $\texttt{s = "rat", t = "car"}$
输出： $\texttt{false}$

数据范围

$\texttt{1} \le \texttt{s.length, t.length} \le \texttt{5} \times \texttt{10}^\texttt{4}$
$\texttt{s}$ 和 $\texttt{t}$ 仅包含小写英语字母

进阶

如果输入字符串包含 Unicode 字符应该如何解决？你能否调整你的解法来应对这种情况？

解法一

思路和算法

当 $t$ 是 $s$ 的字母异位词时， $s$ 中的每个字符在 $t$ 中恰好出现一次，因此 $s$ 和 $t$ 的长度相同。如果 $s$ 和 $t$ 的长度不同，则 $t$ 不是 $s$ 的字母异位词，返回 $\text{false}$ 。

由于两个互为字母异位词的字符串包含的字符完全相同，只有顺序可能不同，因此将两个互为字母异位词的字符串排序之后，得到的有序字符串相同。只要将两个字符串排序之后比较是否相同，即可判断两个字符串是否互为字母异位词。

由于 Java 中的 $\texttt{String}$ 类型的对象是不可变的，因此需要对 $s$ 和 $t$ 分别调用 $\texttt{toCharArray}$ 方法得到 $\texttt{char}$ 类型的数组，然后对两个字符数组排序，比较排序后的两个字符数组是否相同。

代码

class Solution {
    public boolean isAnagram(String s, String t) {
        if (s.length() != t.length()) {
            return false;
        }
        char[] sArr = s.toCharArray();
        char[] tArr = t.toCharArray();
        Arrays.sort(sArr);
        Arrays.sort(tArr);
        return Arrays.equals(sArr, tArr);
    }
}

复杂度分析

时间复杂度： $\log n)$ ，其中 $n$ 是字符串 $s$ 的长度。当 $s$ 和 $t$ 的长度不同时只需要 $O (1)$ 的时间就能知道不是字母异位词，当 $s$ 和 $t$ 的长度相同时需要 $\log n)$ 的时间对两个字符数组排序，排序后需要 $O (n)$ 的时间比较两个字符数组是否相同，因此时间复杂度是 $\log n)$ 。
空间复杂度： $O (n)$ ，其中 $n$ 是字符串 $s$ 的长度。需要创建两个长度为 $n$ 的字符数组，排序需要 $O(\log n)$ 的递归调用栈空间，因此空间复杂度是 $O (n)$ 。

解法二

思路和算法

根据字母异位词的定义可知，当 $t$ 是 $s$ 的字母异位词时，同一个字符在 $s$ 中的出现次数和在 $t$ 中的出现次数相同。因此可以通过统计每个字符在 $s$ 和 $t$ 中的出现次数判断 $t$ 是否是 $s$ 的字母异位词。

首先判断 $s$ 和 $t$ 的长度是否相同，如果长度不同，则 $t$ 不是 $s$ 的字母异位词，返回 $\text{false}$ 。

由于 $s$ 和 $t$ 只包含小写英语字母，因此可以创建长度为 $26$ 的数组 $\textit{counts}$ 记录每个字符的计数。

首先遍历 $s$ ，对于每个字符，将其在 $\textit{counts}$ 中对应的计数加 $1$ 。然后遍历 $t$ ，对于每个字符，将其在 $\textit{counts}$ 中对应的计数减 $1$ 。如果遍历 $s$ 和 $t$ 结束之后， $\textit{counts}$ 中的每个计数都是 $0$ ，则每个字符在 $s$ 和 $t$ 中的出现次数相同， $t$ 是 $s$ 的字母异位词。

实现方面，可以有以下两点优化。

由于在遍历 $t$ 的过程中， $\textit{counts}$ 中的计数只会减少，因此当 $\textit{counts}$ 中的计数出现负数时，该计数对应的字符在 $t$ 中的出现次数大于在 $s$ 中的出现次数，此时 $t$ 不是 $s$ 的字母异位词，返回 $\text{false}$ 。
如果在遍历 $t$ 的过程中， $\textit{counts}$ 中的计数都没有出现负数，则遍历结束之后可以确定 $t$ 是 $s$ 的字母异位词，不需要再次遍历 $\textit{counts}$ 检查是否每个计数都是 $0$ ，可以直接返回 $\text{true}$ 。理由如下。
1. 遍历 $t$ 的过程中， $\textit{counts}$ 中的计数都没有出现负数，说明任何字符在 $t$ 中的出现次数不超过在 $s$ 中的出现次数。
2. 假设存在一个字符，该字符在 $t$ 中的出现次数小于在 $s$ 中的出现次数，则 $t$ 的长度小于 $s$ 的长度，与 $t$ 的长度等于 $s$ 的长度矛盾。因此任何字符在 $t$ 中的出现次数都等于在 $s$ 中的出现次数， $t$ 是 $s$ 的字母异位词。

代码

class Solution {
    public boolean isAnagram(String s, String t) {
        if (s.length() != t.length()) {
            return false;
        }
        int[] counts = new int[26];
        int length = s.length();
        for (int i = 0; i < length; i++) {
            char c = s.charAt(i);
            counts[c - 'a']++;
        }
        for (int i = 0; i < length; i++) {
            char c = t.charAt(i);
            counts[c - 'a']--;
            if (counts[c - 'a'] < 0) {
                return false;
            }
        }
        return true;
    }
}

复杂度分析

时间复杂度： $O (n)$ ，其中 $n$ 是字符串 $s$ 的长度。当 $s$ 和 $t$ 的长度不同时只需要 $O (1)$ 的时间就能知道不是字母异位词，当 $s$ 和 $t$ 的长度相同时需要遍历 $s$ 和 $t$ 各一次并维护计数，每次遍历都需要 $O (n)$ 的时间。
空间复杂度： $O(|\Sigma|)$ ，其中 $\Sigma$ 是字符集，这道题中字符集为全部小写英语字母， $|\Sigma| = 26$ 。需要使用数组记录每个字符的计数，空间为 $O(|\Sigma|)$ 。

解法三

思路和算法

对于进阶问题，如果输入字符串包含 Unicode 字符，则字符集不再局限于小写英语字母，因此不能使用数组维护计数，而是需要使用哈希表维护计数。

对于 Unicode 字符的处理，可以使用解法二的思路，将数组换成哈希表即可。

代码

class Solution {
    public boolean isAnagram(String s, String t) {
        if (s.length() != t.length()) {
            return false;
        }
        Map<Character, Integer> counts = new HashMap<Character, Integer>();
        int length = s.length();
        for (int i = 0; i < length; i++) {
            char c = s.charAt(i);
            counts.put(c, counts.getOrDefault(c, 0) + 1);
        }
        for (int i = 0; i < length; i++) {
            char c = t.charAt(i);
            counts.put(c, counts.getOrDefault(c, 0) - 1);
            if (counts.get(c) < 0) {
                return false;
            }
        }
        return true;
    }
}

复杂度分析

时间复杂度： $O (n)$ ，其中 $n$ 是字符串 $s$ 的长度。当 $s$ 和 $t$ 的长度不同时只需要 $O (1)$ 的时间就能知道不是字母异位词，当 $s$ 和 $t$ 的长度相同时需要遍历 $s$ 和 $t$ 各一次并维护计数，每次遍历都需要 $O (n)$ 的时间。
空间复杂度： $O(|\Sigma|)$ ，其中 $\Sigma$ 是字符集，这道题中字符集为全部小写英语字母， $|\Sigma| = 26$ 。需要使用哈希表记录每个字符的计数，空间为 $O(|\Sigma|)$ 。