给你两个字符串
s1
和s2
,写一个函数来判断s2
是否包含s1
的排列。如果是,返回true
;否则,返回false
。
对于这道题的解法代码,基本上和最小覆盖子串一模一样,只需要改变几个地方:
1、本题移动
left
缩小窗口的时机是窗口大小大于t.size()
时,应为排列嘛,显然长度应该是一样的。2、当发现
valid == need.size()
时,就说明窗口中就是一个合法的排列,所以立即返回true
。至于如何处理窗口的扩大和缩小,和最小覆盖子串完全相同。
3. 无重复字符的最长子串
class Solution {
public int lengthOfLongestSubstring(String s) {
HashMap<Character,Integer>hm=new HashMap();
//字符,索引
int left=0;
int len=0;
for(int i=0;i<s.length();i++){
if(hm.containsKey(s.charAt(i))){
left=Math.max(left,hm.get(s.charAt(i))+1);
}
hm.put(s.charAt(i),i);
len=Math.max(len,i-left+1);
}
return len;
}
}
Rabin Karp字符串匹配算法
所以优化的关键在于,我们能不能不要真的把子字符串生成出来,而是用一些其他形式的唯一标识来表示滑动窗口中的子字符串,并且还能在窗口滑动的过程中快速更新?
你把
AGCT
四种字符等价为0123
四个数字,那么长度为L = 10
的一个碱基序列其实就可以等价为一个十位数,这个数字可以唯一标识一个子串。而且窗口移动的过程,其实就是给这个数字的最低位添加数字,并删除最高位数字的过程,回顾之前的讲解,添加和删除数字的运算就是两个公式,可以在O(1)
的时间完成这样,我们就避免了直接生成子串存入集合,而是生成一个十位数来表示子串,而且生成这个十位数的时间花费为
O(1)
,从而降低了匹配算法的时间复杂度其实你想下,你把一个字符串对象转化成了一个数字,这是什么?这就是你设计的一个哈希算法,生成的数字就可以认为是字符串的哈希值。在滑动窗口中快速计算窗口中元素的哈希值,叫做滑动哈希技巧。
class Solution {
public List<String> findRepeatedDnaSequences(String s) {
int[] krap = new int[s.length()]; //krap称为s的模式串。
for (int i = 0; i < krap.length;i++){
switch(s.charAt(i)){
case 'A':
krap[i] = 0;
break;
case 'G':
krap[i] = 1;
break;
case 'C':
krap[i] = 2;
break;
case 'T':
krap[i] = 3;
break;
}
}
int left = 0;
int right = 0;
int L = 10;//窗口长度
int R = 4;//4进制
HashSet<Integer> seen = new HashSet<>();//窗口哈希值集合
HashSet<String> res = new HashSet<>();
int window = 0;//当前窗口的哈希值
while(right < krap.length){
window = R * window + krap[right];//扩大窗口,相当于低位增加数字
right++;
if (right - left == L){
if (seen.contains(window)){//出现了重复子串
res.add(s.substring(left,right));
}else{
seen.add(window);
}
//缩小窗口,相当于删除高位数字
window = window - krap[left] * (int)Math.pow(R,L-1);
left++;
}
}
return new LinkedList<>(res);
}
}