1相关介绍
在介绍基因家族收缩和扩张之前,有一个概念是绕不过去的,就是基因家族。
基因家族(gene family),是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物,
同一家族基因可以紧密排列在一起,形成一个基因簇,但多数时候,它们是分散在同一染色体的不同位置,或者存在于不同的染色体上的,各自具有不同的表达调控模式。
在基因组项目中,通常会选择自己要研究的物种和其近缘的物种通过比对来寻找基因家族。通常我们有两种方式来得到基因家族:1
利用orthmcl软件进行blast比对(如果有谁不太清楚,出门左拐->上一篇文档)2将多条物种蛋白muscle比对之后,利用hmmer和pfam数据库比对,如果能比对上同一个蛋白质家族,认为这几条序列是隶属于同一个基因家族。当然也可以两种方法结合起来做。我做项目过程中大多选择第一种,因此今天利用第一种得到的基因家族信息来介绍基因家族收缩和扩张。
基因组文章中大多采用cafe软件来进行该项分析。(各个基因组统计结果)
2软件介绍
cafe是美国xx大学开发的一款xx软件,软件的原理大致如下,通常情况下比较两个物种基因家族数时,只是单纯的比较大小,如5大于2
,那么认为家族数