题目 392. 判断子序列
给定字符串 s 和 t ,判断 s 是否为 t 的子序列。
你可以认为 s 和 t 中仅包含英文小写字母。字符串 t 可能会很长(长度 ~= 500,000),而 s 是个短字符串(长度 <=100)。
字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"是"abcde"的一个子序列,而"aec"不是)。
示例 1:
s = “abc”, t = “ahbgdc”
返回 true.
示例 2:
s = “axc”, t = “ahbgdc”
返回 false.
简单介绍:
难度:简单
使用语言:JAVA。
这道题来自leetcode题库的二分查找标签。
解题思路:
首先看题、分析题意,我们可以明确一个关键点:
1.如何减少遍历的时间复杂度
既然,我们已经分析出来题目的关键任务了,下面我们就可以开始思考实现了。
我们采用算法与数据结构的思路来剖析一下这题,
数据结构:
要实现对数据的操作,我们要先明确存储数据的数据结构。
该题的数据结构的作用:
1.数组存储
算法 :双指针
class Solution {
public boolean isSubsequence(String s, String t) {
int n = s.length(), m = t.length();
int i = 0, j = 0;
while(i < n && j < m){
if(s.charAt(i) == t.charAt(j)){
i++;
}
j++;
}
return i==n;
}
}
后续挑战 :
如果有大量输入的 S,称作S1, S2, … , Sk 其中 k >= 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?
解题思路:
当 S 数量非常大的时候,再去一个个遍历 T 肯定是不行的。
这时候可以用我们学过的 KMP 算法来寻找子字符串,由于博主能力有限,看的不是很懂,贴上大神的代码以供参考。
算法:
在这种情况下,我们需要在匹配前对 T 做预处理,利用一个二维数组记录每个位置的下一个要匹配的字符的位置,这里的字符是’a’ ~ ‘z’,所以这个数组的大小是 dp[n][26],n 为 T 的长度。那么每处理一个子串只需要扫描一遍 Si 即可,因为在数组的帮助下我们对 T 是“跳跃”扫描的。比如下面匹配 “ada” 的例子,只需要“跳跃”三次。
class Solution {
public boolean isSubsequence(String s, String t) {
// 预处理
t = " " + t; // 开头加一个空字符作为匹配入口
int n = t.length();
int[][] dp = new int[n][26]; // 记录每个位置的下一个ch的位置
for (char ch = 0; ch < 26; ch++) {
int p = -1;
for (int i = n - 1; i >= 0; i--) { // 从后往前记录dp
dp[i][ch] = p;
if (t.charAt(i) == ch + 'a') p = i;
}
}
// 匹配
int i = 0;
for (char ch : s.toCharArray()) { // 跳跃遍历
i = dp[i][ch - 'a'];
if (i == -1) return false;
}
return true;
}
}
作者:lil-q
链接:https://leetcode-cn.com/problems/is-subsequence/solution/javati-jie-he-hou-xu-tiao-zhan-by-lil-q/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。