187. 重复的DNA序列

最新推荐文章于 2024-02-24 18:17:17 发布

Sun_Sky_Sea

最新推荐文章于 2024-02-24 18:17:17 发布

阅读量138

点赞数

分类专栏： # 字符串文章标签： leetcode

本文链接：https://blog.csdn.net/u013243296/article/details/125254750

版权

字符串专栏收录该内容

48 篇文章 0 订阅

订阅专栏

该博客介绍了如何解决一个DNA序列分析问题，即在给定的DNA字符串中找出所有重复出现的长度为10的子序列。通过遍历字符串并使用字典来统计每个10碱基子串的出现次数，当计数达到2时，将子串添加到结果列表中。提供的代码示例展示了如何实现这一过程。

摘要由CSDN通过智能技术生成

187. 重复的DNA序列

原始题目链接：https://leetcode.cn/problems/repeated-dna-sequences/

DNA序列由一系列核苷酸组成，缩写为 ‘A’, ‘C’, ‘G’ 和 ‘T’.。

例如，“ACGAATTCCG” 是一个 DNA序列。
在研究 DNA 时，识别 DNA 中的重复序列非常有用。

给定一个表示 DNA序列的字符串 s ，返回所有在 DNA 分子中出现不止一次的长度为 10 的序列(子字符串)。你可以按任意顺序返回答案。

示例 1：

输入：s = “AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT”
输出：[“AAAAACCCCC”,“CCCCCAAAAA”]
示例 2：

输入：s = “AAAAAAAAAAAAA”
输出：[“AAAAAAAAAA”]

提示：

0 <= s.length <= 105
s[i]==‘A’、‘C’、‘G’ or ‘T’

解题思路：

遍历字符串s，从s的开头到len(s) - 10 + 1的索引长度，跨度是10，每次统计出现的次数，当等于2次的时候符合题意，大于2次的话再记录到答案列表中会出现重复，所以判断条件等于2次即可。

代码实现：

class Solution:
    def findRepeatedDnaSequences(self, s: str) -> List[str]:
        from collections import defaultdict
        ans = []
        # 用一个字典记录字符串出现的次数
        # 使用int初始化
        freq_dict = defaultdict(int)

        # 遍历s，能索引的下标是从0到len(s) - 10 + 1
        for i in range(len(s) - 9):
            # 每次去i到i+10的跨度的子字符串
            sub_s = s[i: i + 10]
            # 统计次数
            freq_dict[sub_s] += 1
            # 题意要求不止一次，那么出现次数大于等于2次满足要求
            # 大于2会插入重复值，或者使用set去重也可以
            if freq_dict[sub_s] == 2:
                ans.append(sub_s)
        
        return ans

参考文献：
https://leetcode.cn/problems/repeated-dna-sequences/solution/zhong-fu-de-dnaxu-lie-by-leetcode-soluti-z8zn/

Sun_Sky_Sea

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
187. 重复的DNA序列

原始题目链接：https://leetcode.cn/problems/repeated-dna-sequences/DNA序列由一系列核苷酸组成，缩写为 ‘A’, ‘C’, ‘G’ 和 ‘T’.。例如，“ACGAATTCCG” 是一个 DNA序列。在研究 DNA 时，识别 DNA 中的重复序列非常有用。给定一个表示 DNA序列的字符串 s ，返回所有在 DNA 分子中出现不止一次的长度为 10 的序列(子字符串)。你可以按任意顺序返回答案。示例 1：输入：s = “AAAAACCCCCAAA
复制链接

扫一扫

专栏目录