LeetCode刷题实战187：重复的DNA序列

最新推荐文章于 2024-10-08 20:32:22 发布

编程IT圈

最新推荐文章于 2024-10-08 20:32:22 发布

阅读量104

点赞数

文章标签：算法字符串 sms 哈希 isp

本文链接：https://blog.csdn.net/itcodexy/article/details/113856141

版权

算法的重要性，我就不多说了吧，想去大厂，就必须要经过基础知识和业务逻辑面试+算法面试。所以，为了提高大家的算法能力，这个公众号后续每天带大家做一道算法题，题目就从LeetCode上面选！

今天和大家聊的问题叫做 重复的DNA序列 ，我们先来看题面：

https://leetcode-cn.com/problems/reverse-words-in-a-string-ii/

All DNA is composed of a series of nucleotides abbreviated as 'A', 'C', 'G', and 'T', for example: "ACGAATTCCG". When studying DNA, it is sometimes useful to identify repeated sequences within the DNA.

Write a function to find all the 10-letter-long sequences (substrings) that occur more than once in a DNA molecule.

题意

所有 DNA 都由一系列缩写为 'A'，'C'，'G' 和 'T' 的核苷酸组成，例如："ACGAATTCCG"。在研究 DNA 时，识别 DNA 中的重复序列有时会对研究非常有帮助。

编写一个函数来找出所有目标子串，目标子串的长度为 10，且在 DNA 字符串 s 中出现次数超过一次。

示例

示例 1：

输入：s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出：["AAAAACCCCC","CCCCCAAAAA"]

示例 2：

输入：s = "AAAAAAAAAAAAA"
输出：["AAAAAAAAAA"]

提示：

0 <= s.length <= 105
s[i] 为 'A'、'C'、'G' 或 'T'

解题

思路分析：利用map标记各个长度为10的子串出现的次数，出现多次的就是结果。C++代码如下：

class Solution {
public:
  vector<string> findRepeatedDnaSequences(string s) {
    vector<string> result;
    unordered_map<string, int> myMap;//用于关联各个长度为10的子串出现的次数
    int strSize = s.size();
    for (int beginIndex = 0; beginIndex <= strSize - 10; ++beginIndex) {
      string tempRes = s.substr(beginIndex, 10);
      if (++myMap[tempRes] == 2) {//第一次出现两次，避免重复
        result.push_back(tempRes);
      }
    }
    return result;
  }
};

好了，今天的文章就到这里，如果觉得有所收获，请顺手点个在看或者转发吧，你们的支持是我最大的动力。

上期推文：

LeetCode1-180题汇总，希望对你有点帮助！

LeetCode刷题实战181：超过经理收入的员工

LeetCode刷题实战182：查找重复的电子邮箱

LeetCode刷题实战183：从不订购的客户

LeetCode刷题实战184：部门工资最高的员工

LeetCode刷题实战185：部门工资前三高的所有员工

LeetCode刷题实战186：翻转字符串里的单词 II