前言
在进行基因家族收缩扩张分析时,常用的软件就是cafe4,cafe4能够根据输入的树文件和基因家族文件(gene_families.txt)进行分析,得到基因家族在不同物种的进化过程中的扩张和收缩情况和各个进化节点的基因家族的扩张和收缩情况,怎样使用cafe4进行基因家族的扩张和收缩分析呢?
流程
1.下载安装cafe4
conda install -c bioconda cafe#conda安装
或者在网站下载压缩包https://github.com/hahnlab/CAFE.git
然后进入压缩包所在的位置
执行
unzip -zxvf CAFE-master.zip
进行解压
然后进入解压后的文件目录并安装
cd CAFE-master
autoconf#目录中没有configure时需要执行
./configure
make
make install
这样就完成了cafe4的安装
cafe5同理
cafe5安装包下载地址为
https://github.com/hahnlab/CAFE5
按照同样的方法进行安装
2.写好cafe.sh脚本(如下)
#! cafe
# version
# date
load -i gene_families.txt -t 10 -l logfile.txt -p 0.05
tree
(Creinhardtii:0.429987,(((Taestivum:0.102837,(Sbicolor:0.0363328,Zmays:0.0496597):0.0939642):0.12921,(Atrichopoda:0.237091,(Athaliana:0.212598,((Vvinifera:0.139376,(Ppersica:0.141709,Ptrichocarpa:0.138014):0.0181127):0.0218628,(Stuberosum:0.0320639,Slycopersicum:0.0597023):0.165945):0.0227048):0.0437418):0.0400436):0.0910188,((Ppatens:0.295903,Mpolymorpha:0.298935):0.0536718,Smoellendorffii:0.282815):0.079667):0.429987)
lambda -l 1.22764
report resultfile
保存成.sh格式
其中tree后面的是newick格式的物种树
这里的物种树必须是不带标签的物种树,不然后面会报错导致分析无法进行,图也无法绘制
何为不带标签的物种树呢
物种树1(不带标签)
Tree:(Creinhardtii:0.429987,(((Taestivum:0.102837,(Sbicolor:0.0363328,Zmays:0.0496597):0.0939642):0.12921,(Atrichopoda:0.237091,(Athaliana:0.212598,((Vvinifera:0.139376,(Ppersica:0.141709,Ptrichocarpa:0.138014):0.0181127):0.0218628,(Stuberosum:0.0320639,Slycopersicum:0.0597023):0.165945):0.0227048):0.0437418):0.0400436):0.0910188,((Ppatens:0.295903,Mpolymorpha:0.298935):0.0536718,Smoellendorffii:0.282815):0.079667):0.429987)
物种树2(带标签)
(Creinhardtii:0.429987,(((Taestivum:0.102837,(Sbicolor:0.0363328,Zmays:0.0496597)0.959844:0.0939642)0.841199:0.12921,(Atrichopoda:0.237091,(Athaliana:0.212598,((Vvinifera:0.139376,(Ppersica:0.141709,Ptrichocarpa:0.138014)0.308735:0.0181127)0.411995:0.0218628,(Stuberosum:0.0320639,Slycopersicum:0.0597023)0.97601:0.165945)0.371056:0.0227048)0.674837:0.0437418)0.478488:0.0400436)0.714472:0.0910188,((Ppatens:0.295903,Mpolymorpha:0.298935)0.657106:0.0536718,Smoellendorffii:0.282815)0.581747:0.079667)1:0.429987)
我们可以发现加颜色的地方,带标签的物种树和不带标签的物种树树不同的,而cafe4可以识别这些标签,并最终生成一个带有相同标签的.cafe文件,但后续的分析脚本无法识别这些标签,因此需要去除。
去除方法
1.首先使用figtree打开newick或者txt文件,此时得到的是一个基本的树
2.左上角操作:file-Export Trees,勾选save as currently displayed。这样就得到了一个没有标签的树
lambda 后面是 λ 值(基因出生率/死亡率),可以先使用cafe5进行分析使用CAFE5进行基因家族扩张和收缩分析https://yanzhongsino.github.io/2021/10/29/bioinfo_gene.family_CAFE5/
得到λ值,再使用 - l参数进行指定,在运行完cafe5之后得到的.cafe文件中,会有
lambda和lamtree两行,第一行是整个物种树规定的λ,第二个是各个节点的λ值,可以使用-l参数指定整个树的λ,也可以用-t 指定各个节点的λ
也可以使用 -s 参数自动搜索λ
report参数指定输出的文件名前缀
2.然后在python>3.4环境中运行
cafe cafe.sh
得到.cafe 文件
后续将使用.cafe文件进行进一步的分析和绘图
未完待续
时间有限,有些地方没有讲的特别仔细,大家可以留言我们一起学习,共同进步
(* ̄︶ ̄)