染色体病(chromosomal disorders)
染色体病是由于各种原因引起的染色体数目和(或)形态结构异常的疾病。“染色体核型分析”就是这类疾病的诊断或筛查技术,可以分析染色体数量变化(多了或少了染色体)和染色体较大的形态结构变化。
低深度全基因组测序(CNV-seq)
可以发现染色体细微的变化即染色体核型分析不了的变化,比如可以发现染色体上的某个或者多个“基因”数量的改变(如增加或减少),也能发现染色体数量的改变,但无法检测具有某个或多个碱基改变(如增加、减少、替换、位移等);如果没有基因数量的变化,则无法发现不同染色体之间的片段交换(即基因在不同染色体上的相互交换、变动等)。
拷贝数变异(CNV)
“基因“或某一段DNA序列的数量改变(如增加或减少),由此引起的疾病叫基因组疾病。如果是增多引起的,那就叫染色体重复综合征;如果是减少(缺失)引起的,那就叫染色体缺失综合征。因此染色体微阵列分析技术(CMA)或CNV-seq主要检测染色体重复/缺失综合征。
全基因组测序(WGS)
在全基因组的范围内,发现某个或多个碱基序列的改变(如增加、减少、替换、位移等);能发现染色体上的某个或者多个”基因“数量改变(如增加或减少等)。在没有基因数量的变化情况,可以发现不同染色体之间的片段交换,无法检测染色体的形体变化,但可以分析染色体数量的变化。
全外显子组测序(WES)
在“外显子区域”内,发现某个或多个碱基改变(如增加、减少、替换、位移等),能发现染色体上的某个或者多个”基因“改变(如增加或减少等)。无法发现不同染色体之间的片段交换,无法检测染色体的形体变化。在整个人类全基因组序列中,外显子区域只占1%,但是却包含了85%左右的已知碱基变异。
单基因疾病
某个基因的某个或多个碱基改变(如增加、减少、替换等)引起的疾病被称为单基因疾病。WGS或WES主要检测单基因疾病,同时也可以检测基因组疾病、染色体疾病。
外显率(penetrance)
外显率是指一定环境条件下,群体中某一基因型个体表现出相应表型的百分率。外显率等于100%时称为完全外显(complete penetrance),低于100%时则为不完全外显(incomplete penetrance)或外显不全。
片段重复(segmental duplications, SDs)
片段重复是较大的(>1kb),高相似度(>90%)的重复序列, 是人类基因组中最后得到完整测序和组装的区域。它们通常发生在中心粒、亚端粒和间质区,占人类基因组的5%左右。SDs在人类演化、遗传多样性以及疾病中的发挥重要作用。基因组重复长期以来被认为是结构变化和基因创新的重要来源,是产生新基因和新基因功能发生适应性变化的关键。在人类中,SDs促进减数分裂不等交叉事件,从而导致与之相关联的反复重排。约5%发育迟缓和自闭症与SDs相关。
SDs分为2类:
(1) 染色体间(interchromosomal):重复序列在非同源染色体之间;
(2)染色体内(intrachromosomal):重复序列在同一染色体区域内,这些重复序列通常被称为LCRs。
低拷贝重复序列(low copy repeats, LCRs)
低拷贝重复序列长度通常为10~300 kb,序列一致性超过95%。虽然LCRs在大多数哺乳动物中很少见,但由于在灵长类动物进化过程中的显著扩张,LCRs约占单倍体型人类基因组的6.6%。在人类中,Y染色体和22染色体的SDs比例最大,分别为50.4%和11.9%。LCRs通常被用作SDs的同义词,也有人认为SDs同时包含高复制重复(high copy repeats),在这种情况下,LCRs被视为SDs的一个子集。LCRs介导的NAHR,主要引起再发性基因组重排,即同一种基因组的重排发生在不同的个体中。
非等位基因同源重组(non-allelic homologous recombination, NAHR)
由于序列的高序列同源性,它们易发生减数分裂错位和重组,这一机制称为NAHR。NAHR是修复断裂染色体的一种生物学机制,可导致基因组重排。在人类所有基因组重排(也称为结构变异)中,有相当一部分(约10% ~ 22%)是由NAHR造成。