leetcode 187. 重复的DNA序列

最新推荐文章于 2024-04-21 19:46:46 发布

Qin酱

最新推荐文章于 2024-04-21 19:46:46 发布

阅读量196

点赞数

分类专栏： leetcode 文章标签： python 算法字符串

本文链接：https://blog.csdn.net/qq_38650028/article/details/107851226

版权

leetcode 专栏收录该内容

194 篇文章 0 订阅

订阅专栏

187. 重复的DNA序列
所有 DNA 都由一系列缩写为 A，C，G 和 T 的核苷酸组成，例如：“ACGAATTCCG”。在研究 DNA 时，识别 DNA 中的重复序列有时会对研究非常有帮助。

编写一个函数来查找目标子串，目标子串的长度为 10，且在 DNA 字符串 s 中出现次数超过一次。

示例：

输入：s = “AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT”
输出：[“AAAAACCCCC”, “CCCCCAAAAA”]

思路比较简单，就是从头开始每次取十个，看看是否在集合内，如果不在就加入集合，如果在就说明不是第一次出现了。
这个时候加入输出列表，注意，这里加入输出的时候需要去重。

class Solution:
    def findRepeatedDnaSequences(self, s: str) -> List[str]:
        n = len(s)
        dic = set()
        out = []
        for i in range(10, n+1):
            dna = s[i-10:i]
            if dna not in dic:#看是否在集合内
                dic.add(dna)
            else:
                if dna not in out:#加入输出的时候去重
                    out.append(dna)
        return out