参考基因组中的特殊序列

若参考基因组序列不包含chr*random 和 chrUn序列,原来属于chrrandom 和 chrUn的read可能比对到chr1-22,chrX,chrY上相似区域,造成假阳性比对,后续这些reads提供的信息不可靠。通过增加这一部分参考序列,使来自这些区域的reads正确比对,减少假阳性。后续分析不考虑chrrandom 和 chrUn*。

human GRCh37
unlocalized sequences”:知道染色体但不知具体位置的序列
unplaced sequences”:知道来自人类基因组序列,但不知与染色体的关系
alternate loci”:来自基因组特定区域,代表该区域序列的多样性
human hg19…
chr*_random sequences” : 知道来自哪条染色体但不知具体位置的序列

The chr*_random sequences are unplaced sequence on those reference chromosomes.

chrUn_* sequences” : 知道来自人类基因组序列,但不知与染色体的关系

The chrUn_* sequences are unlocalized sequences where the corresponding reference chromosome has not been determined.

高粱super玉米scoffold
基因组组装时部分片段无法挂载到染色体上,因此除了染色体外还有一些片段留在参考基因组当中,有的基因组将这些片段之间加N链接成super序列,也有的直接不处理以scoffold出现
水稻sy和un
Sequences from BACs and the Syngenta assembly of Nipponbare that could not be anchored are on separate pseudomolecules, the Unanchored and the Syngenta chromosomes.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值