生信人填坑记 orthofinder的安装和基础使用

orthofinder软件的安装【使用conda】

你好! 这是你以为的使用conda安装orthofinder conda install orthofinder
或者稍微高级一点 conda install -c bioconda orthofinder !!

应该在大多数conda用户的计算机上这个方法会出现环境冲突!这个时候就会有人想起来使用conda创建新环境之后再安装。

conda create -n orthofinder
conda install orthofinder
然而这个方法可以解决一部分问题,但是依旧有的同学解决不了这个软件的安装问题。
在这里有两点我希望大家可以利用起来!

在安装conda之后的第一件事是安装mamba

在国内使用conda的同学我相信很多人都会遇到-|- -|- -|- -|- -|- -|- -|- -|- 一直转圈。

所以我强烈安利 安装conda之后的第一件事就是 conda install -c conda-forge mamba
然后几乎所有的conda命令都可以把conda替换成mamba。

合理利用yml文件

根据软件的官网提供的依赖软件
mafft
muscle
iqtree
raxml
raxml-ng
fasttree
BLAST
DIAMOND
MMSeqs2

构造yaml文件

name: orthofinder
channels:
  - defaults
  - conda-forge
  - bioconda
dependencies:
  - python=3.8
  - numpy
  - pandas
  - mafft
  - muscle
  - iqtree
  - raxml
  - raxml-ng
  - fasttree
  - BLAST
  - DIAMOND
  - MMSeqs2
  - orthofinder

然后使用mamba mamba env create -f orthofinder.yaml 当然,很多软件都会自带一个这样的文件,conda装不了的时候可以去软件官网溜达溜达。

orthofinder软件的基础使用

软件的是由很简单,将你要跑的物种的蛋白质文件放在work/data目录下,文件名都用物种缩写,后缀统一就行。
然后在work目录下,先进入环境 然后运行

conda activate orthofinder
orthofinder -f ./data -t 36 -a 16 -M msa -S blast -A mafft -T raxml-ng

-t指定比对线程;
-a指定分析线程;
-M指定推断基因树的方法: dendroblast(default)/msa;
-S指定比对软件: diamond(default)/blast/blast_gz/mmseqs/blast_nucl
-A指定多序列比对(MSA)使用软件:mafft(default)/muscle;需要指定-M msa
-T指定画树软件:fasttree(default)/raxml/raxml-ng/iqtree

结果文件

软件会在data下面生成一个OrthoFinder的文件夹,里面就是我们的运行结果。
其中常用的有两个结果,第一个是Orthogroups文件夹下的Orthogroups.GeneCount.tsv,这个文件里保存着每个家族在每个物种里的成员数量。Orthogroups.GeneCount.tsv
有了这个文件我们可以进行不同物种之间的基因家族韦恩图绘制,可以使用jvenn,但是在使用之前需要对文件进行修改,将每个物种的家族数替换成家族名字,使用orthofinder2jvenn.py这个脚本。

import numpy as np
import pandas as pd
import sys

def chang(n,gene):
	if n != 0:
		return gene
	else:
		return ''

data = pd.read_csv(sys.argv[1],header = 0, sep='\t', comment='#')
print(data)

columns = [column for column in data]
print(columns)
for i in range(1,len(columns)-1):
	column = columns[i]
	print(column)
	data[column] = data.apply(lambda row:chang(row[column],row[columns[0]]), axis = 1)
print(data)

data.to_csv('jvenn_'+sys.argv[1], index=False,sep='\t',mode='w')

修改之后的jvenn_Orthogroups.GeneCount.tsv文件:
jvenn_Orthogroups.GeneCount.tsv
然后就可以打开jvenn,进行可视化了。将需要展示的物种名字填在name处,把家族列表复制到输入框就可以生成你自己的韦恩图了。

进入web
韦恩图

第二个常用的结果就是用于研究基因家族扩张与收缩的文件MultipleSequenceAlignments/SpeciesTreeAlignment.fa 和Species_Tree/SpeciesTree_rooted.txt这两个文件用法比较复杂,需要python2,python3多种环境,以及r8s和cafe等软件工具。所以以后单独出一期解释。(写到这儿饭点到了,吃饭要紧…)

不知道有多少生信人在此迷茫,我曾经在各种生信群里求助最后消息都如同泥牛入海。为此我重新建立一个群,进群的小伙伴备注以下自己使用什么软件。咱尽量做到基因组组装方面有问必答。也欢迎大佬来群视察,要是能开个基因组组装的讲座啥的就再好不过了!
进群请charles_kiko@163.com 备注基因组加群

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要在生信领域使用Linux系统,可以按照以下步骤进行安装: 1. 首先,选择一个合适的Linux发行版。在生信领域中,常用的发行版有Ubuntu、CentOS和Fedora等。你可以根据个人喜好和需求选择其中之一。 2. 下载所选发行版的镜像文件。你可以在官方网站上找到适用于你的计算机的镜像文件,并下载到本地。 3. 制作启动盘。将下载的镜像文件写入USB闪存驱动器或光盘,并制作成可启动的安装介质。 4. 将启动盘插入计算机,并重新启动计算机。在启动过程中,按下对应的按键(通常是F2、F10、F12或DEL),进入计算机的BIOS设置。 5. 在BIOS设置中,将启动顺序调整为从USB或光盘启动。保存设置并重新启动计算机。 6. 进入安装界面后,按照提示进行安装。选择合适的语言、时区和键盘布局等设置,并选择安装类型(建议选择完全安装)。 7. 在分区设置中,可以选择自动分区或手动分区。如果你对分区不熟悉,建议选择自动分区。 8. 设置用户名和密码,并等待安装完成。 9. 完成安装后,重新启动计算机,并使用你设置的用户名和密码登录系统。 10. 根据需要,安装生物信息学相关的软件和工具。你可以使用包管理器(如apt或yum)来安装所需的软件包。 安装完成后,你就可以开始在Linux系统上进行生信分析和开发工作了。得定期更新系统和软件,以保持系统的安全性和稳定性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值