欢迎关注”生信修炼手册”!
Transposable elements 转座元件占真核生物基因组很大一部分,对转座元件的精确注释有助于研究其生物学特性,揭示基因组的进化过程。
Dfam数据库对多个真核生物的转座元件进行多序列比对,构建了转座元件的家族信息。官网如下
http://www.dfam.org/
目前最新版本为Dfam 2.0, 对于每个家族,以DF编号唯一标识,示意图如下
Dfam同时还提供了一个隐马尔可夫模型,可以用于序列比对,下载地址如下
http://www.dfam.org/web_download/Release/Dfam_2.0/
和Dfam类似,还有一个Dfam Consensus 数据库,该数据库对基因组上的重复序列进行了详细分类,链接如下
http://www.dfam-consensus.org/#/public/te_classes/
Low_Complexity代表低复杂度序列