所有 DNA 都由一系列缩写为 ‘A’,‘C’,‘G’ 和 ‘T’ 的核苷酸组成,例如:“A
CGAATTCCG”。在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。
编写一个函数来找出所有目标子串,目标子串的长度为 10,且在 DNA 字符串 s 中出现次数超过一次。
示例 1:
输入:s = “AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT”
输出:[“AAAAACCCCC”,“CCCCCAAAAA”]
示例 2:
输入:s = “AAAAAAAAAAAAA”
输出:[“AAAAAAAAAA”]
利用哈希表去重,sub截取字符串。
所有
leetcode
代码已同步至github
欢迎
star
/**
- @author 一条coding
*/
class Solution {
public List findRepeatedDnaSequences(String s) {
List list = new ArrayList();
HashMap<String, Integer> map = new HashMap<>();
HashSet set = new HashSet<>();
if(s.length()<10){
return list;
}
for (int i = 0; i <= s.length()-10; i++) {
String substring = s.substring(i, i + 10);
if (map.containsKey(substring)){
set.add(substring);
}else {
map.put(substring,1);
}
}
return new ArrayList<>(set);
}
}
复杂度分析
- 时间复杂度:O(NL)
⭐今天是坚持刷题更文的第82/100天
⭐各位的点赞、关注、收藏、评论、订阅就是一条创作的最大动力
⭐更多数据结构和算法讲解欢迎关注专栏《糊涂算法》
为了回馈各位粉丝,礼尚往来,给大家准备了一些学习资料