本节就要进入更为关键的分析流程了——菌群组成的分析。进行16S测序的目的就是为了研究不同样本间的菌群组成差异,本节我们将讲解如何用qiime1绘制菌群丰度分布图、菌群差异分析以及绘制菌群丰度热图。
绘制菌群丰度分布图
菌群分类统计图能够展示每个组或者每个样本的菌群比例。在qiime1中用于生成该图像的命令是summarize_taxa_through_plots.py,该命令具体包括3个指令:
# Plot group average 绘制每组平均值
summarize_taxa_through_plots.py \
-i otu_table.biom \
-o taxa_summary_plots \
-m mapping_file.txt \
-c SampleType
# Plot each sample 绘制每个样本
summarize_taxa_through_plots.py \
-i otu_table.biom \
-o taxa_summary_plots \
-m mapping_file.txt
最后会产生一个文件夹。其中有一个网页.html会展示所有的图片结果,你也可以在文件夹中找到原始的图片。
丰度差异的检验
通过绘制菌群丰度分布图后,你大致了解了样本中丰度较高的菌群主要有哪些。那么接下来,你肯定会好奇在你的实验组和对照组中究竟有哪些OTU存在显著差异。Qiime1提供了检测差异的命令,当然你也可以使用其他非常流行的方法比如LEfSe。之后我们会对如何使用LEfSe进行讲解,本节我们先讲解如何使用Qiime1自带的命令进行检验比较。
Qiime推荐了两种方法,第一种是geroup_significance.py
group_significance.py \
-i otu_table.biom \
-o kruskal_wallis_test.txt \
-m mapping_file.txt \
-c SampleType \
-s kruskal_wallis
其中-s方法可以选择下述检验方法:nonparametric_t_test, bootstrap_mann_whitney_u, ANOVA, kruskal_wallis, g_test, parametric_t_test, mann_whitney_u
另外一种是利用DESeq2进行更加深入的差异检验(做过RNA-seq分析的人一定对这个名字DESeq2不陌生)。具体如下:
differential_abundance.py
-i otu_table.biom
-o diff_otus.txt
-m mapping_file.txt
-a metagenomeSeq_fitZIG
-c Treatment
-x Control
-y Fast
其中-c是告诉程序需要比较哪一项,比如在此处我们想要比较不同Treatment的差异,其中Treatment有两组Control和Fast,所以告诉程序-x是Control组,-y是Fast组。
样本丰度归一化
除了使用相对丰度对样本进行归一化,Qiime1还提供了DESeq2和CSS这些归一化方法。经过归一化的样本更加适合进行fitZIG和DESeq2的差异检验。
normalize_table.py \
-i otu_table.biom \
-o otu_table_deseq2_normalized.biom \
-a DESeq2
绘制丰度热图
热图是一种直观的展示各个样本不同菌群丰度的形式。Qiime1也可以直接制作热图。
make_otu_heatmap.py \
-i otu_table.biom \
-o heatmap_sorted.pdf \
-m mapping_file.txt \
-t rep_set.tre