Leetcode161: Repeated DNA Sequences

243 篇文章 0 订阅

All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: "ACGAATTCCG". When studying DNA, it is sometimes useful to identify repeated sequences within the DNA.

Write a function to find all the 10-letter-long sequences (substrings) that occur more than once in a DNA molecule.

For example,

Given s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT",

Return:
["AAAAACCCCC", "CCCCCAAAAA"].

用Map的话超内存了,改用bitsmap,因为只有4个字母,所以只要用两位就可以做为一个字母的编码,10个字母就是20位,所以创建一个2^20大小的数组就可以解决问题了。

class Solution {
public:
    int chartoint(char a)
    {
        if(a == 'A') return 0;
        if(a == 'C') return 1;
        if(a == 'G') return 2;
        if(a == 'T') return 3;
    }
    vector<string> findRepeatedDnaSequences(string s) {
        vector<string> res;
        set<string> temp;
        string str;
        if(s.size()<10)
            return res;
        unsigned int val = 0;
        for(int i = 0; i < 9; i++)
        {
            val <<= 2;
            val |= chartoint(s[i]);
        }
        int map[1024*1024] = {0};
        for(int i = 9; i < s.size(); i++)
        {
            val <<= 14;
            val >>= 12;
            val |= chartoint(s[i]);
            map[val]++;
            if(map[val] > 1)
            {
                str = s.substr(i-9, 10);
                temp.insert(str);
            }
        }
        for(set<string>::iterator i = temp.begin(); i != temp.end(); ++i)
        {
            res.push_back(*i);
        }
        return res;
    }
};


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值