一、题目
1、题目描述
DNA序列 由一系列核苷酸组成,缩写为 ‘A’, ‘C’, ‘G’ 和 ‘T’.。
例如,“ACGAATTCCG” 是一个 DNA序列 。
在研究 DNA 时,识别 DNA 中的重复序列非常有用。
给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。
示例 1:
输入:s = “AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT”
输出:[“AAAAACCCCC”,“CCCCCAAAAA”]
示例 2:
输入:s = “AAAAAAAAAAAAA”
输出:[“AAAAAAAAAA”]
2、基础框架
- C++版本给出的基础框架如下:
3、原题链接
https://leetcode.cn/problems/repeated-dna-sequences/
二、解题报告
1、思路分析
(
1
)
(1)
(1)每连续10个元素组成一个子序列。
(
2
)
(2)
(2)遍历字符串,用map容器记录所有子序列的个数,遍历map容器,子序列个数大于1的子序列即为重复子序列。
2、时间复杂度
3、代码详解
class Solution {
public:
vector<string> findRepeatedDnaSequences(string s) {
map<string, int>mp;
vector<string>re;
int n = s.length();
string p = "";
int j = 0;
for (int i=1;i<=n;i++) {
p += s[i-1];
if (i/10 > 0) {
mp[p]++;
p = p.substr(1,-1);
}
}
for (map<string, int>::iterator it = mp.begin();it != mp.end();it++) {
if (it->second > 1) {
re.push_back(it->first);
}
}
return re;
}
};
三、本题小知识
1.map容器的使用。
1)声明:map<string, int>mp;
2)初始值:map的value初始值为0
3)插入数据的方式:用数组的方式插入mp[s] = 1;
4)遍历方式:使用迭代器map<string, int>::iterator it = mp.begin();
5)迭代器取数据方式:key:it->first value: it->second