leetcode1525. 字符串的好分割数目
给你一个字符串 s
,一个分割被称为 「好分割」 当它满足:将 s
分割成 2 个字符串 p
和 q
,它们连接起来等于 s
且 p
和 q
中不同字符的数目相同。
请你返回 s
中好分割的数目。
示例 1:
输入:s = "aacaba"
输出:2
解释:总共有 5 种分割字符串 "aacaba" 的方法,其中 2 种是好分割。
("a", "acaba") 左边字符串和右边字符串分别包含 1 个和 3 个不同的字符。
("aa", "caba") 左边字符串和右边字符串分别包含 1 个和 3 个不同的字符。
("aac", "aba") 左边字符串和右边字符串分别包含 2 个和 2 个不同的字符。这是一个好分割。
("aaca", "ba") 左边字符串和右边字符串分别包含 2 个和 2 个不同的字符。这是一个好分割。
("aacab", "a") 左边字符串和右边字符串分别包含 3 个和 1 个不同的字符。
示例 2:
输入:s = "abcd"
输出:1
解释:好分割为将字符串分割成 ("ab", "cd") 。
示例 3:
输入:s = "aaaaa"
输出:4
解释:所有分割都是好分割。
示例 4:
输入:s = "acbadbaada"
输出:2
提示:
s
只包含小写英文字母。1 <= s.length <= 10^5
方法:哈希集合
思路:
本题可以直接使用模拟来解决。
我们可以知道,长度为n的字符串,可以有n-1种分割方式。
我们从头开始遍历,使用一个集合(哈希表)word来保存目前遍历到的字符串中存在的字符(集合会将重复的字符过滤)。
使用一个长度为n的数组begin,begin[i]表示s[:i+1]子串中存在的不同字符数(即集合word此时的长度)。
然后我们将word集合清空,从s的最后往前遍历,直到s[1](因为遍历到s[0]的话,右侧字符串为s,左侧字符串不存在,不符合题意),加入遍历到字符s[i],那么此时word的长度即为s[i:]子串中的不同字符数。此时如果len(word) = begin[i-1],那么即是一种好分割。
统计所有的好分割数,返回即可。
- 遍历了两次,而对集合求长度的时间复杂度为O(1),所以总的时间复杂度为O(2n),渐进时间复杂度为O(n)。
- 使用了一个集合和数组,空间复杂度为O(n)。
代码:
Python3:
class Solution:
def numSplits(self, s: str) -> int:
res = 0
n = len(s)
# begin[i]存放s[:i+1]中不同字符的数量
begin = [0 for _ in range(n)]
word = set()
for i in range(n):
word.add(s[i])
begin[i] = len(word)
word.clear()
# 下面开始从后往前遍历,统计右半部分的情况,i的时候,len(word)即s[i:]的不同字符数
# 与之相匹配的即为begin[i-1],如果两者相等,则为好分割。
for i in range(n-1,0,-1):
word.add(s[i])
if begin[i-1] == len(word):
res += 1
return res
cpp:
class Solution {
public:
int numSplits(string s) {
int res = 0;
int n = s.size();
// begin[i]存放s[:i+1]中不同字符的数量
auto begin = vector<int>(n,0);
unordered_set<char> word;
for (int i = 0; i < n-1; ++i){
word.insert(s[i]);
begin[i] = word.size();
}
word.clear();
// 下面开始从后往前遍历,统计右半部分的情况,i的时候,len(word)即s[i:]的不同字符数
// 与之相匹配的即为begin[i-1],如果两者相等,则为好分割。
for (int i=n-1 ; i > 0; --i){
word.insert(s[i]);
if (begin[i-1] == word.size()) res += 1;
}
return res;
}
};