文章目录
人类参考基因组知识
人类和小鼠的参考基因组由Genome Reference Consortium组织进行维护
官网:https://www.ncbi.nlm.nih.gov/grc
对于人类参考基因组而言,最常使用的两个版本是GRCh37和GRCh38
分别对应与UCSC提供的hg19和hg38两个参考基因组
Chromosomes, scaffolds and contigs
这三个概念出现在基因组组装中,实际上,我们使用的参考基因组也是对一些人(千人基因组计划)的DNA进行打断,测序得到的序列组装到一起的。最初用于组装的这些DNA片段就被称为contigs,而根据这些contig的关联情况组装出来的更大的片段就是scaffolds,然后将这些scaffolds进行组装就成了染色体,但是不是所有的scaffolds都能组装到一起的,实际上,scaffolds根据其是否被定位分为三种类型:
- placed scaffolds:已经被定位到染色体上的某个位置
- unlocalised scaffolds:虽然已经被定位到了某条染色体上,但是具体的位置或者方向仍未确定
- unplaced scaffolds: 还未确定所属的染色体
Haplotypes and patches
这里的Haplotypes指的是针对基因组上的某一块区域的不同版本的序列