在微生物16S/ITS/18S测序分析及相关的文章中,我们经常可以看到这样的图,称为稀释曲线(Rarefaction curves)。
稀释曲线是从样品中随机抽取一定测序量的数据(序列条数),统计它们所对应的OTUs种类(代表物种),并以抽取的测序数据量与对应的代表OTUs来构建曲线。横坐标代表随机抽取的序列数量,纵坐标代表观测到的OTUs种类数量,样本曲线的延伸终点的横坐标位置为对应样本的测序数量。稀释曲线可直接反映测序数据量的合理性,并间接反映样品中物种的丰富程度,当曲线趋向平坦时,说明测序数据量渐进合理,更多的数据量只会产生少量新OTUs(物种);反之表明不饱和,增加数据量可以发现更多OTUs。
这种稀释曲线实质上反映了Alpha多样性中的物种丰富度指数(Richness)信息。除此之外,在相关的文章中,我们有时还可以看到以Shannon指数、Chao1指数等绘制的稀释曲线,如下所示(注:在16S/ITS/18S测序分析中,常见observed species,其实就是Richness指数的另一种名称)。无论这些稀释曲线代表了物种丰富度(累计数量)、Shannon指数、Chao1指数还是其它,总之均代表了Alpha多样性指数的信息,因此它们均可以统称为Alpha多样性曲线。
在前篇,白鱼小编已经为大家介绍了群落多样性分析中常见Alpha多样性指数概念,及其在R语言中的计算方法。与之对应,本篇将简介如何使用R作统计并绘制Alpha多样性曲线。
示例数据、R脚本等,已上传至百度盘(提取码488s)。
https://pan.baidu.com/s/1HInewdVJ-T15hPHxI8gmYg
网盘文件“otu_table.txt”为某16S扩增子测序所得OTU丰度表格,可以理解为物种丰度表。表中每一列为一个样本,每一行为一种OTU,交叉区域为每种OTU在各样本中的丰度。
另一文件“otu_tree.tre”为使用各OTU代表序列构建的进化树文件(即OTU水平的16S进化树,已存储为nwk格式)。纯文本模式打开查看该进化树文件,内容长这样。
接下来首先使用R计算微生物群落的多种Alpha多样性指数,每一种Alpha多样性指数都会用到OTU丰度表;对于进化树文件,将用于计算一种特殊的多样性指数,谱系多样性。之后,再通过计算结果绘制Alpha多样性曲线。
R语言绘制Alpha多样性曲线
Alpha多样性曲线作图思路:将原始的