给定字符串 s
和字符串数组 words
, 返回 words[i]
中是s
的子序列的单词个数 。
字符串的 子序列 是从原始字符串中生成的新字符串,可以从中删去一些字符(可以是none),而不改变其余字符的相对顺序。
- 例如,
“ace”
是“abcde”
的子序列。
示例 1:
输入: s = "abcde", words = ["a","bb","acd","ace"]
输出: 3
解释: 有三个是 s 的子序列的单词: "a", "acd", "ace"。
Example 2:
输入: s = "dsahjpjauf", words = ["ahjpjau","ja","ahbwzgqnuk","tnmlanowax"]
输出: 2
提示:
1 <= s.length <= 5 * 104
1 <= words.length <= 5000
1 <= words[i].length <= 50
words[i]
和 s 都只由小写字母组成。
分析:题目给出了字符串s和一个字符串数组words,我们需要统计字符串数组中有多少个字符串是字符串s的子序列。这里子序列的意思是可以不连续的,刚开始我看错了是连续了,然后就是一个自动机了,直接上板子就可以了。这个不是的话就得另换思路了。我们可以先试一下暴力去解决,用双指针,一根指针指向字符串s,还有一根指针指向words【i】,然后循环,进行比较,如果字符相同,就都向后移动一格,如果不想等,指向字符串s的之指针往后移一格。但是这样子,我们的时间复杂度就是n*m,5*107,必定超时。我们必须想办法去优化。
那我们考虑能否加速这个过程呢,如果我们将字符串s中的字符的位置按照对应的字符进行存储,
令其为数组 pos,其中 pos[c]存储的是字符串 s 中字符为 c的从小到大排列的位置。那么对于需要匹配的字符 t[j] 我们就可以通过在对应的 pos数组中进行「二分查找」来找到第一个大于当前 i指针的位置,若不存在则说明匹配不成功,否则就将指针 iii 直接移到找到的对应位置,并将指针 j后移一个单位,这样就加速了指针 i的移动。其实就是用一个链表来存储字符想对应的下标,然后对链表list进行二分查找,查找下标,是否满足情况,直接上代码,我感觉这个思路还是比较神奇的
AC代码:
class Solution {
public int numMatchingSubseq(String s, String[] words) {
List<Integer> pos[] = new List[26] ;
for (int i =0 ;i<26;i++){
pos[i] = new ArrayList<>();
}
//其中 pos[c] 存储的是字符串 s中字符为 c 的从小到大排列的位置,list存储对应的下标
for (int i =0 ;i<s.length(); i++){
pos[s.charAt(i)-'a'].add(i) ;
}
int res = words.length ;
for (String word : words) {
if (word.length()>s.length()){
res -- ;
continue;
}
int p =-1 ;
for (int j =0 ;j<word.length();j++){
char c = word.charAt(j);
if (pos[c-'a'].isEmpty()||(pos[c-'a'].get(pos[c-'a'].size()-1))<=p){
res-- ;
break;
}
p = binarySearch(pos[c-'a'],p) ;
}
}
return res ;
}
private int binarySearch(List<Integer> po, int p) {
int left = 0 ;
int right = po.size()-1 ;
while (left<right){
int mid = left+(right-left)/2 ;
if (po.get(mid)>p){
right = mid ;
}else {
left = mid+1 ;
}
}
return po.get(left) ;
}
}