202310-宏基组学物种分析工具-MetaPhlAn4安装和使用方法-Anaconda3- centos9 stream

最新推荐文章于 2024-08-16 09:31:23 发布

2401_83946509

最新推荐文章于 2024-08-16 09:31:23 发布

阅读量1k

点赞数 15

分类专栏： 2024年程序员学习文章标签：运维 linux 面试

本文链接：https://blog.csdn.net/2401_83946509/article/details/138872181

版权

2024年程序员学习专栏收录该内容

270 篇文章 0 订阅

订阅专栏

为了做好运维面试路上的助攻手，特整理了上百道 【运维技术栈面试题集锦】 ，让你面试不慌心不跳，高薪offer怀里抱！

这次整理的面试题，小到shell、MySQL，大到K8s等云原生技术栈，不仅适合运维新人入行面试需要，还适用于想提升进阶跳槽加薪的运维朋友。

本份面试集锦涵盖了

174 道运维工程师面试题
128道k8s面试题
108道shell脚本面试题
200道Linux面试题
51道docker面试题
35道Jenkis面试题
78道MongoDB面试题
17道ansible面试题
60道dubbo面试题
53道kafka面试
18道mysql面试题
40道nginx面试题
77道redis面试题
28道zookeeper

总计 1000+ 道面试题，内容又全含金量又高

174道运维工程师面试题

1、什么是运维?

2、在工作中，运维人员经常需要跟运营人员打交道，请问运营人员是做什么工作的?

3、现在给你三百台服务器，你怎么对他们进行管理?

4、简述raid0 raid1raid5二种工作模式的工作原理及特点

5、LVS、Nginx、HAproxy有什么区别?工作中你怎么选择?

6、Squid、Varinsh和Nginx有什么区别，工作中你怎么选择?

7、Tomcat和Resin有什么区别，工作中你怎么选择?

8、什么是中间件?什么是jdk?

9、讲述一下Tomcat8005、8009、8080三个端口的含义？

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题，mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以点击这里获取！

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

使用conda环境安装（推荐）

本示例使用anaconda3，

以下是在anaconda3中安装MetaPhlAn4的步骤：

步骤1：安装conda

如果您尚未安装conda，请使用以下命令在终端中安装：

到这里去找安装包吧，什么版本都有，这里下载linux64最新版

https://repo.anaconda.com/archive

###下载安装包
wget https://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh
###安装
sh Anaconda3-2023.09-0-Linux-x86_64.sh

###先进去后会要让同意许可协议，注意太快可能错过跳出，到后面慢一点向下翻
#到最后询问是否同意时输入yes
##遇到按键太快跳过的话重新执行安装命令再次进入

#在配置安装目录时要注意输入自己想要安装的目录

步骤2：创建conda环境

打开终端并输入以下命令，创建一个名为“metaphlan4”的conda环境：

#创建metaphlan4的conda环境
conda create -n metaphlan4 python=3.7

mamba create -n metaphlan4 python=3.7

步骤3：激活conda环境

输入以下命令，激活“metaphlan4”环境：

#激活指定环境，任选一种，建议mamba
conda activate metaphlan4
mamba activate metaphlan4
source activate metaphlan4

步骤4：安装MetaPhlAn4

使用以下命令安装MetaPhlAn4：

#在激活环境中安装metaphlan
conda install -c bioconda -c conda-forge metaphlan
#mamba也挺不错的，速度还快，自己配置即可
mamba install -c bioconda -c conda-forge metaphlan
#需要一点时间，等待完成

步骤5：测试MetaPhlAn4

输入以下命令测试安装是否成功：

metaphlan --version

如果可以正确显示版本信息，则安装成功。

步骤6：配置MetaPhlAn数据库

默认情况下可以使用metaphlan --install命令可以安装数据库，按照官方建议添加–bowtie2db参数，并指定conda目录外的专用数据库目录/mnt/metaphlan4_db，大家按需求修改。指定conda外目录的好处就是conda环境目录容量小一些，重新安装时还可以设置此目录作为数据库目录就行，不用重新下载和配置了。

metaphlan --install --bowtie2db /mnt/metaphlan4_db

# MetaPhlAn自动下载的数据库有可能不是最新的，大家可以清空指定文件夹，
# 或将已有数据文件全部移到其他备份目录
# 然后编辑一个mpa_latest
cd /mnt/metaphlan4_db
vim mpa_latest
mpa_vJun23_CHOCOPhlAnSGB_202307

## 这个文件不要有空格不要有空行，就单独这个版本的名称独占一行即可。

可下载版本见ftp: Index of /biobakery4/metaphlan_databases

写入mpa_latest文件中的仅如下面红线标注的版本名称，都是日期结尾

mpa_vJun23_CHOCOPhlAnSGB_202307

mpa_vOct22_CHOCOPhlAnSGB_202212

开始后会自动下载文件和运行bowtie索引

有时候下载速度慢，可能引起失败，建议手动下载最新数据库：

地址在这里：http://cmprod1.cibio.unitn.it/biobakery4/metaphlan_databases/

下载这几个文件：

http://cmprod1.cibio.unitn.it/biobakery4/metaphlan_databases/bowtie2_indexes/mpa_vOct22_CHOCOPhlAnSGB_202212_bt2.md5

http://cmprod1.cibio.unitn.it/biobakery4/metaphlan_databases/bowtie2_indexes/mpa_vOct22_CHOCOPhlAnSGB_202212_bt2.tar http://cmprod1.cibio.unitn.it/biobakery4/metaphlan_databases/mpa_vOct22_CHOCOPhlAnSGB_202212.md5

http://cmprod1.cibio.unitn.it/biobakery4/metaphlan_databases/mpa_vOct22_CHOCOPhlAnSGB_202212.tar

http://cmprod1.cibio.unitn.it/biobakery4/metaphlan_databases/mpa_vOct22_CHOCOPhlAnSGB_202212_marker_info.txt.bz2

http://cmprod1.cibio.unitn.it/biobakery4/metaphlan_databases/mpa_vOct22_CHOCOPhlAnSGB_202212_species.txt.bz2

http://cmprod1.cibio.unitn.it/biobakery4/metaphlan_databases/mpa_latest

下载完成后将所有下载文件放入下面目录（根据自己安装目录找ananconda3的位置，后面路径都一样）：

anaconda3/envs/mpa/lib/python3.7/site-packages/metaphlan/metaphlan_databases

后面第一次去运行metaphlan去注释你的序列的时候会自动建库

使用MetaPhlAn 4：

准备输入文件：MetaPhlAn 4需要输入FASTQ或FASTA格式的文件。如果是PE读取，需要将两个序列文件合并为一个文件。
运行MetaPhlAn 4：在终端中进入MetaPhlAn 4的安装目录，并运行以下命令：

python3 metaphlan --input_file example.fastq --output_file output.txt

其中，–input_file参数指定输入文件的路径和名称，–output_file参数指定输出文件的路径和名称。

查看结果：MetaPhlAn 4的输出文件包含了每个微生物的相对丰度和物种注释信息。可以使用文本编辑器或者Excel等软件打开输出文件进行查看和分析。

conda环境下使用MetaPhlAn4

##激活conda环境
source activate metaphlan4

#直接使用压缩包文件运行，建议使用nohup运行，因为运行时间比较长
#nohup
nohup metaphlan f1.fastq.gz,r2.fastq.gz --bowtie2out f1r2.bowtie2.bz2 --nproc 60 --input_type fastq >f1r2_mtphlan.txt 2>&1 &
#直接运行
metaphlan f1.fastq.gz,r2.fastq.gz --bowtie2out f1r2.bowtie2.bz2 --nproc 60 --input_type fastq -o f1r2_mtphlan.txt

####其中 f1.fastq.gz和r2.fastq.gz分别为样品的双端序列的两个压缩文件，最终我们想要的是f1r2_mtphlan.txt

结果解释：

###前面几行已被注释，使用MetaPhlAn工具合并时会自动过滤掉
#anaconda3/envs/metaphlan4/bin/metaphlan 1.fastq,2.fastq --bowtie2out 1.bt2.bz2 --nproc 30 --input_type fastq -o 1.profiled.txt
#76553269 reads processed
#SampleID	Metaphlan_Analysis
#clade_name	NCBI_tax_id	relative_abundance	additional_species
k__Bacteria	2	99.92666	
k__Archaea	2157	0.07334	
k__Bacteria|p__Proteobacteria	2|1224	89.13284	
k__Bacteria|p__Actinobacteria	2|201174	8.93442	
k__Bacteria|p__Bacteroidetes	2|976	1.83546

私房菜：

###使用merge_metaphlan_tables.py将所有样品的注释结果合并（需要激活metaphlan4的conda环境）
merge_metaphlan_tables.py *.txt > merged_abundance_table.txt

###使用下面语句从合并表中提取物种种水平下的物种注释信息
grep -E '(s__)|(clade_name)' merged_abundance_table.txt |grep -v 't__'|sed 's/^.*s__//g'|awk '{$2=null;print}'|sed 's/\ \ /\ /g'|sed 's/\ /\t/g' > merged_abundance_species.txt
###使用下面语句从合并表中提取物种属水平下的物种注释信息
grep -E '(g__)|(clade_name)' merged_abundance_table.txt |grep -v 's__'|sed 's/^.*g__//g'|awk '{$2=null;print}'|sed 's/\ \ /\ /g'|sed 's/\ /\t/g' > merged_abundance_genus.txt
###使用下面语句从合并表中提取物种科水平下的物种注释信息
grep -E '(f__)|(clade_name)' merged_abundance_table.txt |grep -v 'g__'|sed 's/^.*f__//g'|awk '{$2=null;print}'|sed 's/\ \ /\ /g'|sed 's/\ /\t/g' > merged_abundance_family.txt
###使用下面语句从合并表中提取物种目水平下的物种注释信息
grep -E '(o__)|(clade_name)' merged_abundance_table.txt |grep -v 'f__'|sed 's/^.*o__//g'|awk '{$2=null;print}'|sed 's/\ \ /\ /g'|sed 's/\ /\t/g' > merged_abundance_order.txt
###使用下面语句从合并表中提取物种纲水平下的物种注释信息
grep -E '(c__)|(clade_name)' merged_abundance_table.txt |grep -v 'o__'|sed 's/^.*c__//g'|awk '{$2=null;print}'|sed 's/\ \ /\ /g'|sed 's/\ /\t/g' > merged_abundance_class.txt
###使用下面语句从合并表中提取物种门水平下的物种注释信息


**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**[需要这份系统化的资料的朋友，可以点击这里获取！](https://bbs.csdn.net/topics/618635766)**

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**

/g'|sed 's/\ /\t/g' > merged_abundance_class.txt
###使用下面语句从合并表中提取物种门水平下的物种注释信息


**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**[需要这份系统化的资料的朋友，可以点击这里获取！](https://bbs.csdn.net/topics/618635766)**

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**