利用PfamScan寻找同源基因家族

本文介绍了如何安装和使用hmmer及Pfam_scan.pl来查找同源基因家族。hmmer的安装包括将bin目录添加到PATH中,以便 Pfam_scan.pl调用。Pfam_scan.pl的使用涉及三个主要参数:输入蛋白序列的fasta文件,Pfam-A数据库目录和输出文件名。结果可以通过已知PF编号或蛋白名称进行检索。
摘要由CSDN通过智能技术生成

基因家族鉴定---pfam保守结构域的查找


Pfam是一个蛋白家族数据库,其中Pfam-A是手工确定的高质量的蛋白家族,Pfam-B是自动注释的,是对A的补充。目前已更新到34.0,下载地址为ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/,任选一版本即可,需要两个文件, Pfam-A.hmm.gzPfam-A.hmm.dat.gz

hmmer的安装

由于Pfam-A需要进行二进制的转换,方便运算,所以需要用到hmmer软件。
安装过程如下:

$ wget http://eddylab.org/software/hmmer/hmmer.tar.gz
$ tar zxvf hmmer.tar.gz
$ cd hmmer-3.3
$ ./configure --prefix=`pwd`
$ make
OrthoFinder是一种常用的基于直系同源基因构建物种树的工具,它可以高效地从大规模的基因组数据找到同源基因,进而构建物种树。下面是利用OrthoFinder进行物种树构建的基本步骤: 1. 数据预处理:将待分析的多个物种的基因组数据进行处理,包括基因注释、去除低质量序列、去重、序列比对、格式转换等。 2. 安装和运行OrthoFinder:安装OrthoFinder并按照指导文档进行运行。OrthoFinder的输入文件为每个物种的蛋白质序列文件,输出文件为每个同源基因簇的序列文件和一个物种树文件。 3. 同源基因簇的筛选:根据OrthoFinder输出的同源基因簇的序列文件,筛选出包含所有物种的同源基因簇,并将其进行多序列比对和序列编辑。 4. 构建进化距离矩阵:根据同源基因簇的多序列比对结果,利用序列编辑软件计算不同物种之间的进化距离,并将其记录在一个进化距离矩阵。 5. 构建系统发育树:将进化距离矩阵作为输入,使用系统发育树构建软件构建物种树。 6. 验证树的可靠性:对于构建出来的物种树,需要进行Bootstrap方法、Jackknife方法等进行可靠性验证。 以上是利用OrthoFinder进行物种树构建的基本步骤。需要注意的是,OrthoFinder的结果可能会受到多个因素的影响,如同源基因筛选的严格程度、序列比对的准确性、进化距离计算的方法等。因此,需要进行多次分析和验证,以得到可靠的结果。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值