题目链接:
题目描述:
- 判断子序列
给定字符串 s 和 t ,判断 s 是否为 t 的子序列。
你可以认为 s 和 t 中仅包含英文小写字母。字符串 t 可能会很长(长度 ~= 500,000),而 s 是个短字符串(长度 <=100)。
字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"是"abcde"的一个子序列,而"aec"不是)。
示例 1:
s = “abc”, t = “ahbgdc”
返回 true.
示例 2:
s = “axc”, t = “ahbgdc”
返回 false.
后续挑战 :
如果有大量输入的 S,称作S1, S2, … , Sk 其中 k >= 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?
解决方案:
字符串的问题八成都能用动态规划解决,也是在leetcode上的“动态规划”标签里,但是这个题用其他思想算法效率更高。我是为了巩固动态规划的思想才去找的题,所以今天我们硬着头皮用动态规划做一下。
参考编辑距离那道题,那个题设 dp[i][j] 为把长度为 i 的 word1 转换成长度为 j 的 word2 所使用的的最少操作数,文章链接:
【动态规划】 LeetCode #72 编辑距离
本题我们设 dp[i][j] 为长度为 i 的 s 是长度为 j 的 t 的子序列,是为 true,不是为 false,最后应该返回 dp[s.length()][t.length()]。
状态转移方程式:
若字符相等,dp[i][j] = dp[i-1][j-1]
若字符不等,dp[i][j] = dp[i][j-1]
初始化:第一行都为 1,因为空串一定是 t 的子序列;第一列除了 dp[0][0] 外都为 0。
我们以 s = ‘abc’,t = ‘ahbgdc’ 为例:('0’表示false,'1’表示true)
如果字符相等,如计算 dp[2][3] ,其含义为 ‘ab’ 是否是 ‘ahb’ 的子序列,由于字符 ‘b’ 相等,这个问题也就转化为了 ‘a’ 是否是 ‘ah’ 的子序列,即 dp[i][j] = dp[i-1][j-1]。
如果字符不相等,试想一下什么情况下长度为 i 的 s 串还能是长度为 j 的 t 串的子序列呢?最后一位已经不等了,要想是子序列,除非在此之前的t串已经包含了长度为 i 的 s 串的所有字符。比如 dp[1][3] 的含义是 ‘a’ 是否是 ‘ahb’ 的子序列,‘a’ != ‘b’,那么我们就去看是否在此之前已经满足 ‘a’ 是子序列。因为 ‘a’ 是 ‘ah’ 的子序列,所以 ‘a’ 也是 ‘ahb’ 的子序列,即 dp