思路一: 遍历s,i从0到s.length()-10,因为要确保i之后至少还有10个字符用来匹配。每取到10个字符,就查看i+1到末尾这个字符串里面是否含有当前取到的这10个字符,如果有的话,那说明当前的这10个字符需要输出,是正确答案。但是按这个方式来写代码的话会有一个testcase time limit exceeded,原因是因为有大量的重复计算。至于怎么优化我还没想出来。但是毕竟思路是对的,还是展示一下我的代码吧:
class Solution {
public List<String> findRepeatedDnaSequences(String s) {
List<String> list = new LinkedList<>();
for(int i = 0; i < s.length() - 10; i++){
String curt = s.substring(i,i+10);
if(list.contains(curt)){continue;}
String str = s.substring(i+1);
if(str.contains(curt)){list.add(curt);}
}
return list;
}
}
思路二: 上面思路一相当于是利用了arraylist的contains方法,那么思路二可以认为是巧妙使用了hashset的性质。同样也是遍历s,i从0到s.length()-9。这边为啥可以比思路一多前进一个字符呢,是因为这边我们其实是取s中所有可能的10个字符的字符串。如果当前的10个字符不能加入set,说明set中已经有该字符串,也就是说之前遇到过同样的10个字符,那就表示当前的这10个字符是正确答案,我们需要输出。
class Solution {
public List<String> findRepeatedDnaSequences(String s) {
List<String> list = new ArrayList<>();
Set<String> set = new HashSet<>();
for(int i = 0; i < s.length() - 9; i++){
String curt = s.substring(i,i+10);
if(!set.add(curt) && !list.contains(curt)){list.add(curt);}
}
return list;
}
}
这个代码其实是我按照自己的思路改的,使用的数据结构和该思路作者所用的数据结构不太一样。
最后展示思路二原作者所写的代码,可以说是巧妙的一批了。
public List<String> findRepeatedDnaSequences(String s) {
Set seen = new HashSet(), repeated = new HashSet();
for (int i = 0; i + 9 < s.length(); i++) {
String ten = s.substring(i, i + 10);
if (!seen.add(ten))
repeated.add(ten);
}
return new ArrayList(repeated);
}
总结:无