基因组
在生物学中,一个生物体的基因组是指包含在该生物的DNA(部分病毒是RNA)中的全部遗传信息,或者说是一套染色体中完整的DNA序列。
- 对于单倍体细胞,基因组是指编码序列和非编码序列在内的全部DNA分子。
- 对于有性生殖个体,通常是指一套常染色体和两种性染色体的序列。
- 基因组包括核基因组、线粒体基因染色体中心li组和叶绿体基因组等。
- 一般而言,染色体中心粒附近重复序列多而编码序列少。
- 一个蛋白质编码基因往往包含多个外显子或蛋白质编码序列,外显子被非编码的内含子隔开。
- 许多非编码序列包含假基因(尤其是人类基因组),它们原来是编码序列,但由于进化过程中碱基变异等,丧失了编码蛋白质的功能。
- 微生物基因组往往要小些,其重复序列比例明显不高。
- 玉米基因组转座子类重复序列大量增加,基因组重复序列比例达85%以上。
基因预测
基因组DNA序列上,一个蛋白质编码基因包含编码和非编码序列,其编码序列(外显子)被非编码区(内含子)隔断,蛋白质编码区(CDS)包括大部分外显子序列(除了两端非翻译区域,即