参考基因组中的特殊序列

若参考基因组序列不包含chr*random 和 chrUn序列,原来属于chrrandom 和 chrUn的read可能比对到chr1-22,chrX,chrY上相似区域,造成假阳性比对,后续这些reads提供的信息不可靠。通过增加这一部分参考序列,使来自这些区域的reads正确比对,减少假阳性。后续分析不考虑chrrandom 和 chrUn*。

human GRCh37
unlocalized sequences”:知道染色体但不知具体位置的序列
unplaced sequences”:知道来自人类基因组序列,但不知与染色体的关系
alternate loci”:来自基因组特定区域,代表该区域序列的多样性
human hg19…
chr*_random sequences” : 知道来自哪条染色体但不知具体位置的序列

The chr*_random sequences are unplaced sequence on those reference chromosomes.

chrUn_* sequences” : 知道来自人类基因组序列,但不知与染色体的关系

The chrUn_* sequences are unlocalized sequences where the corresponding reference chromosome has not been determined.

高粱super玉米scoffold
基因组组装时部分片段无法挂载到染色体上,因此除了染色体外还有一些片段留在参考基因组当中,有的基因组将这些片段之间加N链接成super序列,也有的直接不处理以scoffold出现
水稻sy和un
Sequences from BACs and the Syngenta assembly of Nipponbare that could not be anchored are on separate pseudomolecules, the Unanchored and the Syngenta chromosomes.

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值