本文主要讲解了使用Mothur软件对扩增子基因序列进行基于系统型phylogeny的多样性指数分析,并提供了所有过程输出文件。
OTU和基于Phylotype的分析是分类方法,取决于binning过程。相反,基于Phylogeny的方法是尝试使用系统发育树作为输入而不是共享文件来进行相似类型的分析。由于存在这种差异,这些方法比较了不同群落的遗传多样性。
01Alpha多样性
当使用系统发育方法时,α多样性被计算为树中唯一分支长度的总和。使用phylo.diversity命令完成。由于采样深度的差异,对输出进行稀疏化。
命令注释:phylo.diversity命令用于计算系统发育多样性。 |
输出文件:
stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.phylip.1.phylodiv.summary
文件注释:第一列组名,第二列样本数,第三列phyloDiversity。 |
输出文件:stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.phylip.1.phylodiv.rarefaction
02Beta多样性
基于unifrac的度量用于评估两个群落成员(unifrac.unweighted)和结构(unifrac.weighted)之间的相似性。可以使用这些指标并生成PCoA图以比较样本。一个可以使用的beta多样性指标有两个unweighted和weighted。
使用Mothur对tree进行子采样1000次并报告平均值。
命令注释:unifrac.unweighted命令用于执行unweighted.unifrac算法。 |
输出文件:
stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.phylip.uwsummary
文件注释:每两组之间UWScore。 |
输出文件:stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.phylip.1.unweighted.ave.dist
stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.phylip.1.unweighted.std.dist
stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.phylip.tre1.unweighted.phylip.dist
命令注释:unifrac.weighted命令用于执行unweighted.unifrac算法的weighted版本。 |
这些命令将生成距离矩阵,可以使用上述针对基于OTU的分析中介绍的所有beta多样性方法进行分析。
背景补充
i.系统进化树
研究分子进化所要构建的系统发育树(Phylogenetic tree),也叫分子树,对于一个未知的基因或蛋白质序列,可以利用系统发生树确定与其亲缘关系最近的物种。比如你得到了一个新发现的细菌的核糖体RNA,你可以将它跟所有已知的核糖体RNA放在一起,然后用他们构建一棵系统发生树。这样就可以从树上推测出谁和这个新细菌的关系最近。系统发生树还可以预测一个新发现的基因或蛋白质的功能。
系统发生树分为有根树和无根树。有根树就是有根,无根树就是无根,两者是可以互换的。如果按住无根树上某一个点,然后将树上所有的枝条都以这个点为中心向右梳理,就能把它梳成有根树的样子。按住的这个点就是根。所以对于一棵树来说,根的位置是主观的。但不能随意指定哪个内节点当根,毕竟根有其自身的生物学意义,它应该是所有叶子的共同祖先。可以通过外类群(outgroup)来确定根的位置,从而把无根树变成有根树。有根树反映了树上基因或蛋白质进化的时间顺序,通过分析有根树的树枝的长度,可以了解不同的基因或蛋白质以什么方式和速率进化。无根树只反映分类单元之间的距离,不涉及谁是谁的祖先问题。
ii.UniFrac距离
UniFrac距离是beta diversity的群落比较方法,主要是基于系统发生树比较,利用不同样品中OTU代表序列构建进化树,比较特定的进化谱系中是否有显著的微生物群落差异。weighted unifrac方法是在UniFrac的基础上将序列的丰度纳入考虑,能够区分物种丰度的差别,即不仅考虑生物群落的存在与否,还考虑其丰度。在计算中,weighted unifrac按照每条枝指向的叶节点中来自两个群落的比例给每条枝加权重。总结而言之,unweighted unifrac可以检测样品间变化的存在,而weighted unifrac可以更进一步定量的检测样品间不同谱系上发生的变异。
本文提供所有输出文件,百度网盘下载链接:
https://pan.baidu.com/s/11S95Ks1UqX4iX5vh9jyDng
提取码:1234
这篇推文对你有帮助吗?喜欢这篇文章吗?喜欢就不要错过呀,关注本知乎号查看更多的环境微生物生信分析相关文章。亦可以用微信扫描下方二维码关注“环微分析”微信公众号,小编在里面载入了更加完善的学习资料供广大生信分析研究者爱好者参考学习,也希望读者们发现错误后予以指出,小编愿与诸君共同进步!!!
学习环境微生物分析,关注“环微分析”公众号,持续更新,开源免费,敬请关注!
转载自原创文章:
Mothur6进阶_Mothur扩增子基因序列分析_基于系统型phylogeny的多样性指数分析
最后,再次感谢你阅读本篇文章,真心希望对你有所帮助。感谢!