MaAsLin2及R实现

MaAsLin2是下一代MaAsLin(与线性模型的微生物组多变量关联),用于有效确定临床数据和微生物组学特征之间的多变量关联。 MaAsLin2依靠通用线性模型来适应大多数现代流行病学研究设计,包括横断面研究和纵向研究,以及各种过滤,归一化和变换方法。该统计方法可以使用命令行或者R实现。

目录

命令行实现

R实现

准备数据

输出文件

例子

all_results.tsv

significant_results.tsv


命令行实现

  1. 下载源: MaAsLin2.master.zip
  2. 解压压缩包:
    • $ tar xzvf Maaslin2-master.zip
  3. 安装edgeR and metagenomeSeq包.
  4. 安装CRAN依赖包:
    • $ R -q -e "install.packages(c('lmerTest','pbapply','car','dplyr','vegan','chemometrics','ggplot2','pheatmap','hash','logging','data.table','MuMIn','glmmTMB','MASS','cplm','pscl'), repos='http://cran.r-project.org')"
  5. 安装MaAsLin2包(使用R方程时用):
    • $ R CMD INSTALL maaslin2

R实现

安装最新版本R包

if(!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
BiocManager::install("Maaslin2")

install.packages("devtools")
library("devtools")
install_github("biobakery/Maaslin2")

 

准备数据

MaAsLin2 需要两个输入文件

  1. Data文件
    • 制表符分割
    • 样本为行,要素为列
    • 或格式转换
    • 文件中的feature包括taxonomy或gene
  2. Metadata文件
    • 制表符分割
    • 样本为行,要素为列
    • 或格式转换
    • metadata包括性别或年龄

数据文件可以包含未包含在元数据文件中的样本(以及相反的情况)。 对于这两种情况,两个文件中都未包含的那些样本将从分析中删除。 同样,在两个文件中,样本的顺序不必相同。

输出文件

MaAsLin2 有两种输出文件: 数据及图片 

  1. 输出文件
    • all_results.tsv
      • 返回的data
      • q值由小到大排列的结果
      • 第一列为metadata和feature的名称
      • 接下来两列为模型中的值和系数
      • 接下来一列为模型的标准误
      • N 列的为数据点的数目
      • N.not.zero为非0数据的数目
      • pvalue为第二-最后一列
      • qvalue为使用矫正方法之后的p值
    • significant_results.tsv:仅包括P<界值的关联
    • residuals.rds:每个feature的残差
    • fitted.rds:每个feature的拟合值
    • ranef.rds:该文件包含一个数据集,其中包含每个功能的提取随机效果(如果指定了随机效果)。
    • maaslin2.log:日志
  2. 输出图片
    • heatmap.pdf:有意义关联的热图
    • [a-z/0-9]+.pdf
      • 将为每个重要关联生成一个图。
      • 散点图用于连续的元数据。
      • 箱形图用于分类数据。
      • 绘制的数据点是经过归一化,过滤和变换后的。

例子

文件来源 https://ibdmdb.org/ .

HMP2_taxonomy.tsv:是制表符分隔的文件,种类是列,样本是行。 它是分类文件的子集,因此仅包括所有样本的物种丰度。

HMP2_metadata.tsv: 是制表符分隔的文件,其中样本作为行,元数据作为列。 它是元数据文件的子集,因此它仅包含一些字段。

命令行

$ Maaslin2.R --transform=AST --fixed_effects="diagnosis,dysbiosisnonIBD,dysbiosisUC,dysbiosisCD,antibiotics,age" --random_effects="site,subject" --normalization=NONE --standardize=FALSE inst/extdata/HMP2_taxonomy.tsv inst/extdata/HMP2_metadata.tsv demo_output

  • 确保提供MaAsLin2可执行文件的完整路径(例./R/Maaslin2.R)
  • 例子中:
    • HMP2_taxonomy.tsv data路径
    • HMP2_metadata.tsv metadata路径
    • demo_output 输出文件夹

R中

library(Maaslin2)
input_data <- system.file(
    'extdata','HMP2_taxonomy.tsv', package="Maaslin2")
input_metadata <-system.file(
    'extdata','HMP2_metadata.tsv', package="Maaslin2")
fit_data <- Maaslin2(
    input_data, input_metadata, 'demo_output', transform = "AST",
    fixed_effects = c('diagnosis', 'dysbiosisnonIBD','dysbiosisUC','dysbiosisCD', 'antibiotics', 'age'),
    random_effects = c('site', 'subject'),
    normalization = 'NONE',
    standardize = FALSE)

输出文件:

 

all_results.tsv

significant_results.tsv

ref:

https://github.com/biobakery/Maaslin2

  • 6
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值