韦恩图 Venn
venn 图可用于统计多个样品中所共有和独有的OTU 数目,可以比较直观的表现环境样品的OTU 数目组成相似性及重叠情况。通常情况下,分析时选用相似水平为97%的OTU 样品表。
参考文献:
Fouts DE, Szpakowski S, Purushe J, Torralba M, Waterman RC, et al. (2012) Next Generation
Sequencing to Define Prokaryotic and Fungal Diversity in the Bovine Rumen. PLoS ONE 7(11): e48289. doi:10.1371/journal.pone.0048289.
例图:
注:不同的颜色代表不同的样本,如果两个不同颜色圆圈重叠的区域标注有数字100,说明这两个样品均有序列被划分入相同的OTU 中,且这样的OTU 有100 个。图中的样品数量一般为2~5 个。
工具:R,r-venndiagram
#载入VennDiagram包
library(VennDiagram)
venn.diagram(list(A=1:10,B=3:8,C=6:9), fill=c("red","green","blue"), alpha=c(0.5,0.5,0.5), cex=2, cat.fontface=4, fontfamily=3, filename="VennDiagram.tiff")
稀释性曲线 rarefaction curve
稀释性曲线是从样本中随机抽取一定数量的个体,统计这些个体所代表的物种数目,并以个体数与物种数来构建曲线。它可以用来比较测序数据量不同的样本中物种的丰富度,也可以用来说明样本的测序数据量是否合理。采用对序列进行随机抽样的方法,以抽到的序列数与它们所能代表OTU 的数目构建rarefaction curve,当曲线趋向平坦时,说明测序数据量合理,更多的数据量只会产生少量新的OTU,反之则表明继续测序还可能产生较多新的OTU。因此,通过作稀释性曲线,可得出样品的测序深度情况。
参考文献:
Katherine R Amato. et al. Habitat degradation impacts black howler monkey (Alouatta pigra) gastrointestinal microbiomes. The ISME Journal (2013) 7, 1344–1353; doi:10.1038/ismej.
例图:
注:横坐标:随机抽取的测序数据量;纵坐标:观测到的OTU 数量
软件:R,ggplot2
# 安装和载入相关包和数据文件
#source("https://bioconductor.org/biocLite.R")
#biocLite(c("ggplot2","reshape2")) # 没安装过此类包的请手动运行这两行代码安装包
library("ggplot2") # load related packages
library("reshape2")
design = read.table("design.txt", header=T, row.names= 1, sep="\t")
rare = read.table("alpha_rare.txt", header=T, row.names= 1, sep="\t")
# 提取样品组信息
sampFile = as.data.frame(design$genotype,row.names = row.names(design))
colnames(sampFile)[1] = "group"
# 转换宽表格为ggplot通用长表格格式
rare$x = rownames(rare) # 添加x轴列
rare_melt = melt(rare