爱奇艺_DNA序列

最新推荐文章于 2019-05-12 17:11:43 发布

Liam_Fang_

最新推荐文章于 2019-05-12 17:11:43 发布

阅读量612

点赞数

分类专栏：算法，剑指Offer题目

本文链接：https://blog.csdn.net/weixin_39912556/article/details/82149084

版权

算法，同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

剑指Offer题目

8 篇文章 0 订阅

订阅专栏

牛牛又从生物科研工作者那里获得一个任务,这次牛牛需要帮助科研工作者从DNA序列s中找出最短没有出现在DNA序列s中的DNA片段的长度。
例如:s = AGGTCTA
序列中包含了所有长度为1的('A','C','G','T')片段,但是长度为2的没有全部包含,例如序列中不包含"AA",所以输出2。

输入描述:

输入包括一个字符串s,字符串长度length(1 ≤ length ≤ 2000),其中只包含'A','C','G','T'这四种字符。

输出描述:

输出一个正整数,即最短没有出现在DNA序列s中的DNA片段的长度。

输入例子1:

AGGTCTA

输出例子1:

原理就是先对字符串拆分放入Hashset中（Hashset中不存在重复的值），例如例子里面的第一个循环set的值就为A G C T，其size=4，因此不输出。

二第二次循环，也就是i=2时set的值为AG GG GT TC CT TA，其size=6,而对于用4个字符 A G C T组成长度为2的字符串有16种

AA AC AG AT CA CC CG CT GA GC GG GT TA TC TG TG，很显然6<16，例如TG就不存在上述的6种字符中，因此i应该为2.

import java.util.*;
public class Main{
    public static void main(String[] arg){
         Scanner sc = new Scanner(System.in);
         String str = sc.nextLine().trim();
         int j,i,n=str.length();
         for(i=1;i<=n;i++){
             HashSet<String> set = new HashSet<String>();
             for(j=0;j<=n-i;j++){
                  set.add(str.substring(j,j+i));
             }
             if(set.size()<Math.pow(4,i)){
                  System.out.println(i);
                  break;
             }
         }
    }
}

Liam_Fang_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
爱奇艺_DNA序列

牛牛又从生物科研工作者那里获得一个任务,这次牛牛需要帮助科研工作者从DNA序列s中找出最短没有出现在DNA序列s中的DNA片段的长度。例如:s = AGGTCTA序列中包含了所有长度为1的('A','C','G','T')片段,但是长度为2的没有全部包含,例如序列中不包含"AA",所以输出2。输入描述:输入包括一个字符串s,字符串长度length(1 ≤ length ≤ 2000...
复制链接

扫一扫