编程题 DNA序列

编程题 : DNA序列

题目描述:
牛牛又从生物科研工作者那里获得一个任务,这次牛牛需要帮助科研工作者从DNA序列s中找出最短没有出现在DNA序列s中的DNA片段的长度。
例如:s = AGGTCTA
序列中包含了所有长度为1的(‘A’,‘C’,‘G’,‘T’)片段,但是长度为2的没有全部包含,例如序列中不包含"AA",所以输出2。
输入描述:
输入包括一个字符串s,字符串长度length(1 ≤ length ≤ 2000),其中只包含’A’,‘C’,‘G’,'T’这四种字符。
输出描述:
输出一个正整数,即最短没有出现在DNA序列s中的DNA片段的长度。
示例1
输入:AGGTCTA
输出:2
题目分析:
当长度为1时,应包括"A",“T”,“C”,“G”;
当长度为2时,不只有"AA",“TT”,“CC”,“GG”,
还有
“AT”,“AC”,"AG,
“TA”,“TC”, “TG”,
“CA”,“CT”,“CG”,
“GA”,“GC”,“GT”;
因此一共是pow(4,2)=16种。
长度为i的片段一共是pow(4,i)种。
如果只算相同的字符组成的字符串,只能通过80%。所以要注意审题呀!
解题方法:
对于每种长度i (i递增),去数一共有多少种片段,可用set 去除重复的子串。如果长度为i的子串种数少于pow(4,i),说明没有包括所有的子串,就输出i。
AC代码:

#include <algorithm>
#include <vector>
#include <stdio.h>
#include <stdlib.h>
#include <iostream>
#include <sstream>
#include <cstring>
#include <algorithm>
#include <set>
using namespace std;
string s;
int ans = 0;

int main()
{
	cin >>s;
	for (int i = 1;;i++)//长度
	{
		set <string > A;
		for (int j = 0; j != s.length()-i; j++)
			A.insert(A.begin(),s.substr(j, i));
		if (A.size() != pow(4, i))
		{
			cout << i; return 0;
		}
	}
}
  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值