哈希表2——有效的字母异位词

例题

力扣题目链接:https://leetcode.cn/problems/valid-anagram/

题目说明:

给定两个字符串 st ,编写一个函数来判断 t 是否是 s 的字母异位词。
注意:若 s t 中每个字符出现的次数都相同,则称 s 和 t 互为字母异位词。

示例 1:

输入: s = "anagram", t = "nagaram"
输出: true

示例 2:

输入: s = "rat", t = "car"
输出: false

提示:

1 <= s.length, t.length <= 5 * 104
s 和 t 仅包含小写字母

进阶: 如果输入字符串包含 unicode 字符怎么办?你能否调整你的解法来应对这种情况

解题方法

方法一:排序

t t t s s s 的异位词等价于 「 两 个 字 符 串 排 序 后 相 等 」 「两个字符串排序后相等」 。因此我们可以对字符串 s s s t t t 分别排序,看排序后的字符串是否相等即可判断。此外,如果 s s s t t t 的长度不同, t t t必然不是 s s s 的异位词。

代码:

C++

class Solution {
public:
    bool isAnagram(string s, string t) {
        if (s.length() != t.length()) {
            return false;
        }
        sort(s.begin(), s.end());
        sort(t.begin(), t.end());
        return s == t;
    }
};

复杂度分析

时间复杂度 O ( n log ⁡ n ) O(n \log n) O(nlogn),其中 n n n s s s 的长度。排序的时间复杂度为 O ( n log ⁡ n ) O(n\log n) O(nlogn),比较两个字符串是否相等时间复杂度为 O ( n ) O(n) O(n),因此总体时间复杂度为 O ( n log ⁡ n + n ) = O ( n log ⁡ n ) O(n \log n+n)=O(n\log n) O(nlogn+n)=O(nlogn)

空间复杂度 O ( log ⁡ n ) O(\log n) O(logn)。排序需要 O ( log ⁡ n ) O(\log n) O(logn)的空间复杂度。注意,在某些语言(比如 Java & JavaScript)中字符串是不可变的,因此我们需要额外的 O ( n ) O(n) O(n) 的空间来拷贝字符串。但是我们忽略这一复杂度分析,因为:

  • 这依赖于语言的细节;
  • 这取决于函数的设计方式,例如,可以将函数参数类型更改为 char[]

方法二:哈希表

从另一个角度考虑, t t t s s s 的异位词等价于两个字符串中字符出现的种类和次数均相等。由于字符串只包含 26 26 26 个小写字母,因此我们可以维护一个长度为 26 26 26 的频次数组 table \textit{table} table,先遍历记录字符串 s s s 中字符出现的频次,然后遍历字符串 t t t,减去 table \textit{table} table 中对应的频次,如果出现 table [ i ] < 0 \textit{table}[i]<0 table[i]<0,则说明 t t t 包含一个不在 s s s 中的额外字符,返回 false \text{false} false 即可。

class Solution {
public:
    bool isAnagram(string s, string t) {
        if (s.length() != t.length()) {
            return false;
        }
        vector<int> table(26, 0);
        for (auto& ch: s) {
            table[ch - 'a']++;
        }
        for (auto& ch: t) {
            table[ch - 'a']--;
            if (table[ch - 'a'] < 0) {
                return false;
            }
        }
        return true;
    }
};

对于进阶问题 Unicode \text{Unicode} Unicode是为了解决传统字符编码的局限性而产生的方案,它为每个语言中的字符规定了一个唯一的二进制编码。而 Unicode \text{Unicode} Unicode中可能存在一个字符对应多个字节的问题,为了让计算机知道多少字节表示一个字符,面向传输的编码方式的 UTF-8 \text{UTF-8} UTF-8 UTF-16 \text{UTF-16} UTF-16 也随之诞生逐渐广泛使用,具体相关的知识读者可以继续查阅相关资料拓展视野,这里不再展开。

回到本题,进阶问题的核心点在于「字符是离散未知的」,因此我们用哈希表维护对应字符的频次即可。同时读者需要注意 Unicode \text{Unicode} Unicode一个字符可能对应多个字节的问题,不同语言对于字符串读取处理的方式是不同的。
java

class Solution {
    public boolean isAnagram(String s, String t) {
        if (s.length() != t.length()) {
            return false;
        }
        Map<Character, Integer> table = new HashMap<Character, Integer>();
        for (int i = 0; i < s.length(); i++) {
            char ch = s.charAt(i);
            table.put(ch, table.getOrDefault(ch, 0) + 1);
        }
        for (int i = 0; i < t.length(); i++) {
            char ch = t.charAt(i);
            table.put(ch, table.getOrDefault(ch, 0) - 1);
            if (table.get(ch) < 0) {
                return false;
            }
        }
        return true;
    }
}

复杂度分析

时间复杂度 O ( n ) O(n) O(n),其中 n n n s s s 的长度。

空间复杂度: O ( S ) O(S) O(S),其中 S S S 为字符集大小,此处 S = 26 S=26 S=26

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

joker-wt

我的心愿是——世界和平

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值