（6）物种注释

琉璃月月呀

已于 2024-05-22 16:47:59 修改

阅读量370

点赞数

文章标签：数据库

于 2023-05-26 09:50:46 首次发布

本文链接：https://blog.csdn.net/weixin_44562189/article/details/130880013

版权

一、metaphlan 宏基因组对测序结果进行物种注释

二、checkM评估bins的完整性和污染度

三、kraken2进行物种注释

一、metaphlan 宏基因组对测序结果进行物种注释

$ nohup metaphlan UyA_1.clear.fq,UyA_2.clear.fq --bowtie2out metagenome.bowtie2.bz2 --nproc 40 --input_type fastq --bowtie2db /ifs1/User/wuqi/database/metaphlan_dbs -x mpa_v30_CHOCOPhlAn_201901 -o metaphlan_output.txt &
#使用metaphlan进行物种注释 输入用于拼接的两个双端数据（本次用的是经过trimmomatic质控后的clear数据） --bowtie2out 输出一个压缩包（可更改名字） --nproc设置线程  --input_type输入类型 
--bowtie2db /ifs1/User/wuqi/database/metaphlan_dbs -x mpa_v30_CHOCOPhlAn_201901 调用已有的数据库，否则运行时会下载数据库到默认位置
#挂一下nohup贼慢！

$ nohup metaphlan bin.55.fasta --nproc 40 --input_type fasta --bowtie2db /ifs1/User/wuqi/database/metaphlan_dbs -x mpa_v30_CHOCOPhlAn_201901 -o bin.55metaphlan_output.txt &
#metaphlan 宏基因组对测序结果进行物种注释 #输入待注释数据 生成个XX.bowtie2.bz2压缩文件（不知道有啥用） 设置线程 40  输入类型是fastq格式  设置参考数据库 输出XXout文件

二、checkM评估bins的完整性和污染度

但是我感觉这个软件对于地衣很不准确~

$ checkm lineage_wf -t 2 -x fasta ./ output -f XX.txt  
#checkM评估bins的完整性和污染度，基因组组装质量评估 
#-t 是线程数 -x 是输入文件类型 -f 是输出文件 

$ checkm lineage_wf -t 10 -x fa -f checkm_out.txt ~/Qxy/qxycexu/U.aprina/INITIAL_BINNING/concoct_bins ./

在用metawrap分箱时，就有checkM评估的步骤，经常因为它的评估结果不好，导致下一步无法提纯。

三、kraken2进行物种注释

$ kraken2 --db ~/database/kraken2_db/fungi --threads 5 --report report.kreport --output output.out --paired sample_1.fastq sample_2.fastq  
#kraken2进行物种注释  
#设置数据库，设置线程数，输出一个报告（含物种注释情况），和out文件（具体）
$ nohup kraken2 --db ~/database/kraken2_db/fungi --threads 10 --report UyAkrakenreport.kreport --output UyAkrakenoutput.out --paired UyA_1.clear.fq UyA_2.clear.fq &

这个是根据数据库比对来的，库里缺少地衣的数据，多次尝试自己构建Kraken库，失败~