PICRUST2注释

PICRUST2结果文件注释
需要进入picrust2-2.4.2目录

根据官方网站,添加注释的代码如下:
官方网站链接:PICRUST2 wiki

add_descriptions.py -i EC_metagenome_out/pred_metagenome_unstrat.tsv.gz -m EC \
                    -o EC_metagenome_out/pred_metagenome_unstrat_descrip.tsv.gz

add_descriptions.py -i KO_metagenome_out/pred_metagenome_unstrat.tsv.gz -m KO \
                    -o KO_metagenome_out/pred_metagenome_unstrat_descrip.tsv.gz

add_descriptions.py -i pathways_out/path_abun_unstrat.tsv.gz -m METACYC \
                    -o pathways_out/path_abun_unstrat_descrip.tsv.gz

注释前PICRUST2结果文件,可以通过Linux系统获得,或者利用Galaxy平台。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PICRUSt2是一个用于预测微生物基因组功能的工具,它可以通过基因家族注释和基于参考基因组的比对来对16S rRNA或宏基因组数据进行功能预测。在R使用PICRUSt2需要先安装相关的R包,然后按照以下步骤操作: 1. 安装依赖包和PICRUSt2 ```r if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install(c("phyloseq", "dplyr", "stringr", "tidyr", "magrittr")) ``` ```r if (!requireNamespace("devtools", quietly = TRUE)) install.packages("devtools") devtools::install_github("picrust/picrust2", build_vignettes = TRUE) ``` 2. 加载依赖包和PICRUSt2 ```r library(phyloseq) library(dplyr) library(stringr) library(tidyr) library(magrittr) library(picrust2) ``` 3. 读取OTU表和物种注释信息 ```r otu_file <- "otu_table.biom" otu_table <- import_biom(otu_file) tax_file <- "taxonomy.tsv" tax_table <- read.delim(tax_file, header = FALSE, stringsAsFactors = FALSE) colnames(tax_table) <- c("OTU_ID", "taxonomy") ``` 4. 处理物种注释信息 ```r tax_table %<>% separate(taxonomy, into = c("kingdom", "phylum", "class", "order", "family", "genus", "species"), sep = ";") tax_table$OTU_ID <- str_remove(tax_table$OTU_ID, ".*OTU_") ``` 5. 将OTU表和物种注释信息合并成phyloseq对象 ```r tax_table_phylo <- otu_table_to_phyloseq( otu_table = otu_table, tax_table = tax_table, refseq_col = "OTU_ID" ) ``` 6. 运行PICRUSt2 ```r picrust2_pipeline(tax_table_phylo, outdir = "picrust2_output") ``` 在运行过程PICRUSt2会下载和安装必要的参考数据库,并生成预测的功能注释文件。最后,可以使用以下命令读取并处理预测的功能注释文件: ```r ko_file <- "picrust2_output/metagenome_predictions/ko_metagenome_contributions.tsv.gz" ko_table <- read.delim(ko_file, header = TRUE, stringsAsFactors = FALSE, check.names = FALSE) colnames(ko_table)[1] <- "OTU_ID" ko_table$OTU_ID <- str_remove(ko_table$OTU_ID, ".*OTU_") ko_table %<>% pivot_longer(cols = -OTU_ID, names_to = "KO_ID", values_to = "abundance") %>% group_by(OTU_ID, KO_ID) %>% summarize(abundance = sum(abundance)) %>% ungroup() # 根据KO ID获取KEGG通路信息 ko_to_pathway_file <- "picrust2_output/pathways_out/predicted_metagenome_unstratified.tsv.gz" ko_to_pathway_table <- read.delim(ko_to_pathway_file, header = TRUE, stringsAsFactors = FALSE, check.names = FALSE) colnames(ko_to_pathway_table) <- c("KO_ID", "pathway_ID", "abundance") ``` 处理完毕后,就可以使用R的其它工具对预测的功能注释数据进行进一步分析和可视化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值