Rosalind第93题:Assessing Assembly Quality with N50 and N75

Problem

Given a collection of DNA strings representing contigs, we use the N statistic NXX (where XX ranges from 01 to 99) to represent the maximum positive integer  such that the total number of nucleotides of all contigs having length  is at least XX% of the sum of contig lengths. The most commonly used such statistic is N50, although N75 is also worth mentioning.

Given: A collection of at most 1000 DNA strings (whose combined length does not exceed 50 kbp).

Return: N50 and N75 for this collection of strings.

给定代表重叠群的DNA字符串集合,我们使用N统计量NXX(其中XX范围从01到99)表示最大正整数 使得所有重叠群的核苷酸总数具有长度 至少为重叠群长度总和的XX%。尽管N75也值得一提,但最常用的统计数据是N50

给定:最多1000条DNA字符串的集合(其总长度不超过50 kbp)。

返回:此字符串集合的N50和N75。

Sample Dataset

GATTACA
TACTACTAC
ATTGAT
GAAGA

Sample Output

7 6
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值