趋势科技笔试题 DNA串查重 (4进制)

题目大意:给定一个DNA字符串由'A', 'T', 'C', 'G'表示,求长度为10的重复出现的DNA子串,要求不能使用系统或第三方的数据结构,时间复杂度要求为O(n)

题目分析:考虑到只有'A', 'T', 'C', 'G'四种核苷酸,因此可以用一个10位4进制数来唯一标识每个长度为10的DNA子串,这样最大的数字才4^10=1e6+,直接开个2e6的数组记录子串出现的次数,每次只要模一个4^10,从左往右依次记录,遇到出现过的输出即可。复杂度O(n)

样例输入:

TAGCTAATCAGCTAATCAGGTAGCTAATCAGGAACTG

样例输出:

AGCTAATCAG
TAGCTAATCA
GCTAATCAGG

#include <iostream>
#include <string>
using namespace std;
int const MAX = 2e6;
int const MOD = (1 << 20);
int mp[MAX];
string str;

int change(char s) {
	if (s == 'A') {
		return 0;
	}
	if (s == 'T') {
		return 1;
	}
	if (s == 'C') {
		return 2;
	}
	return 3;
}

int main() {
	cin >> str;
	int n = str.length();
	int cur = 0;
	for (int i = 0; i < 10; i ++) {
		cur = cur * 4 + change(str[i]);
		mp[cur] ++;
	}
	for (int i = 10; i < n; i ++) {
		cur = cur * 4 + change(str[i]);
		cur %= MOD;
		if (mp[cur] == 1) {
			for (int j = i - 9; j <= i; j ++) {
				printf("%c", str[j]);
			}
			printf("\n");
		}
		mp[cur] ++;
	}
}





  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值