使用cafe进行基因家族扩张收缩分析并绘图(1)

前言

     在进行基因家族收缩扩张分析时,常用的软件就是cafe4,cafe4能够根据输入的树文件和基因家族文件(gene_families.txt)进行分析,得到基因家族在不同物种的进化过程中的扩张和收缩情况和各个进化节点的基因家族的扩张和收缩情况,怎样使用cafe4进行基因家族的扩张和收缩分析呢?

流程

1.下载安装cafe4

conda install -c bioconda cafe#conda安装

或者在网站下载压缩包https://github.com/hahnlab/CAFE.git

然后进入压缩包所在的位置

执行

unzip -zxvf CAFE-master.zip

 进行解压

然后进入解压后的文件目录并安装

cd CAFE-master
autoconf#目录中没有configure时需要执行
./configure
make
make install 

这样就完成了cafe4的安装

cafe5同理

cafe5安装包下载地址为

https://github.com/hahnlab/CAFE5

按照同样的方法进行安装

2.写好cafe.sh脚本(如下)

#! cafe 
# version 
# date 
load -i gene_families.txt -t 10 -l logfile.txt -p 0.05 
tree          
(Creinhardtii:0.429987,(((Taestivum:0.102837,(Sbicolor:0.0363328,Zmays:0.0496597):0.0939642):0.12921,(Atrichopoda:0.237091,(Athaliana:0.212598,((Vvinifera:0.139376,(Ppersica:0.141709,Ptrichocarpa:0.138014):0.0181127):0.0218628,(Stuberosum:0.0320639,Slycopersicum:0.0597023):0.165945):0.0227048):0.0437418):0.0400436):0.0910188,((Ppatens:0.295903,Mpolymorpha:0.298935):0.0536718,Smoellendorffii:0.282815):0.079667):0.429987)
lambda -l 1.22764	
report resultfile

保存成.sh格式

其中tree后面的是newick格式的物种树

这里的物种树必须是不带标签的物种树,不然后面会报错导致分析无法进行,图也无法绘制

何为不带标签的物种树呢

物种树1(不带标签)

Tree:(Creinhardtii:0.429987,(((Taestivum:0.102837,(Sbicolor:0.0363328,Zmays:0.0496597):0.0939642):0.12921,(Atrichopoda:0.237091,(Athaliana:0.212598,((Vvinifera:0.139376,(Ppersica:0.141709,Ptrichocarpa:0.138014):0.0181127):0.0218628,(Stuberosum:0.0320639,Slycopersicum:0.0597023):0.165945):0.0227048):0.0437418):0.0400436):0.0910188,((Ppatens:0.295903,Mpolymorpha:0.298935):0.0536718,Smoellendorffii:0.282815):0.079667):0.429987)

物种树2(带标签)

(Creinhardtii:0.429987,(((Taestivum:0.102837,(Sbicolor:0.0363328,Zmays:0.0496597)0.959844:0.0939642)0.841199:0.12921,(Atrichopoda:0.237091,(Athaliana:0.212598,((Vvinifera:0.139376,(Ppersica:0.141709,Ptrichocarpa:0.138014)0.308735:0.0181127)0.411995:0.0218628,(Stuberosum:0.0320639,Slycopersicum:0.0597023)0.97601:0.165945)0.371056:0.0227048)0.674837:0.0437418)0.478488:0.0400436)0.714472:0.0910188,((Ppatens:0.295903,Mpolymorpha:0.298935)0.657106:0.0536718,Smoellendorffii:0.282815)0.581747:0.079667)1:0.429987)

我们可以发现加颜色的地方,带标签的物种树和不带标签的物种树树不同的,而cafe4可以识别这些标签,并最终生成一个带有相同标签的.cafe文件,但后续的分析脚本无法识别这些标签,因此需要去除。

去除方法

1.首先使用figtree打开newick或者txt文件,此时得到的是一个基本的树

2.左上角操作:file-Export Trees,勾选save as currently displayed。这样就得到了一个没有标签的树

lambda 后面是 λ 值(基因出生率/死亡率),可以先使用cafe5进行分析使用CAFE5进行基因家族扩张和收缩分析icon-default.png?t=N7T8https://yanzhongsino.github.io/2021/10/29/bioinfo_gene.family_CAFE5/

得到λ值,再使用 - l参数进行指定,在运行完cafe5之后得到的.cafe文件中,会有

lambda和lamtree两行,第一行是整个物种树规定的λ,第二个是各个节点的λ值,可以使用-l参数指定整个树的λ,也可以用-t 指定各个节点的λ

也可以使用 -s 参数自动搜索λ

report参数指定输出的文件名前缀

2.然后在python>3.4环境中运行

cafe cafe.sh

得到.cafe 文件

后续将使用.cafe文件进行进一步的分析和绘图

未完待续

时间有限,有些地方没有讲的特别仔细,大家可以留言我们一起学习,共同进步

(* ̄︶ ̄)

评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值