扩增子图表解读6韦恩图:比较组间共有和特有OTU或分类单元

image

作者: 刘永鑫
日期:2017-7-1
阅读时长:10min

背景介绍(Introduction)

宏基因组学

宏基因组学目前的主要研究方法包括:16S/ITS/18S扩增子、宏基因组、宏转录组和代谢组,其中以扩增子研究最为广泛。

目的意义

本系列文章将带领大家结合较新的16S扩增子相关文献,来理解宏基因组16S扩增子文章中常用图表种类、图中包括的基本信息,以及作者想表达的结果。

主要内容

本系列文章内容包括:箱线图、散点图、热图、曼哈顿图、火山图、维恩图、三元图和网络图等。

学习思路

  1. 罗列知识点,熟悉专业名词,弄个脸熟,即使理解不深刻起码在阅读中不会有抵触情绪;
  2. 结合具体文章读图,实战两三次,基本就是专业人士了。

将来在大家可以很好理解相关文章图表的基础上,希望对分析、统计和绘图相关技术有进一步学习的小伙伴请积极回复并留言吧。如果本系统文章阅读过万,想学分析的留言过百。我还将详细讲解扩增子分析、统计和绘图各步骤的分析实例和源代码,希望大家多多鼓励和支持。

声明:文章的解读仅代表个人理解和观点,有不足处,请读者积极留言批评指正,互相学习,共同进步。

知识点(Method)

韦恩图 Venn Diagram

image
Venn Diagram,也称韦恩图、维恩图、文氏图,用于显示元素集合重叠区域的图示。

韦图绘制工具

常用R语言的VennDiagram包绘制,输出PDF格式方便修改。此外还有非常多的在线工具,使用方便。详见“轻松绘制各种Venn图”

韦恩图在扩增子中用途

  1. 展示各样品和组间共有、各组特有的OTU;由于此类结果缺少统计支持,假阳性率高,近年来使用越来越少。
  2. 展示各组间差异OTU共有或特有情况;较常用。
  3. 展示差异OTU所属的Taxonomy归类后的共有或特有情况;当在OTU水平重叠结果不好,可按分类学级别逐级向上找规律。

看图实战(Result)

示例1. 差异OTU共有或特有

Edwards, J., et al. (2015). PNAS Fig. 2B/C
这篇文章分析了水稻根不同区域的细菌组成,16S分析文章较系统的作品,两年被引用147次,推荐阅读。
image

图2.B/C 韦恩图展示根不同区域富集或下降的OTU的共有和特有情况
1. 图中元素解释
- 图顶部Enriched或Depleted标签代表OTU的类型,分别代表OTU是显著富集/上调,还是显著消减/下调;
- 两图中间图注颜色,紫、绿和蓝分别代表根际、根表和根内;
- 图中非重叠部分为每个组特有,图中重叠部分为重叠各组共有,并将数字标示在该范围内;如B中仅蓝绿重叠区的175代表仅在这两者在共有的OTU数量;而中间的96代表在三组中均共有的OTU。
2. 图表结果:图中显示根际、根表和根内,无论富集还是消减类型中大部分为共有的OTU;这一结果表明,根系微生物组的形成过程,可能是由根际、根表和根内逐步建立起来。
3. 经验和技巧:合适的颜色和透明度选择很重要;可以将各种标签也添加对应颜色更容易区分各组;多韦恩图并排,有利于进一步的比较和规律发现。

附图注原文:
Fig. 2. Rhizocompartments are enriched and depleted for certain OTUs. (A) Enrichment and depletion of the 27,147 OTUs included in the greenhouse experiment for each rhizospheric compartment compared with bulk soil controls as determined by differential abundance analysis. Each point represents an individual OTU, and the position along the y axis represents the abundance fold change compared with bulk soil. (B) Numbers of differentially enriched OTUs between each compartment compared with bulk soil. (C) Numbers of differentially depleted OTUs between each compartment.

示例2. 韦恩图比较共有细菌科

Lebeis, S. L., et al. (2015). Science
这篇文章是Dangl组2015年Science,是最早植物人工重组菌群的文章,研究了植物水杨酸对微生物组的影响,开山之作值得阅读。
image
- 图1. 植物防御激素突变体改变根细菌群体。 D. 上图展示三种水杨酸(SA)下调突变体sid2, pad4和双突DEPS三种材料中差异科水平共有和特有情况。左图为共同富集的科、右图和共同下调的科;
- 图表结果:表明三种突变体在科水平上对细菌群体的调控规律的一致性较好,也进一步证明这些差异科的真实性;
- 作图经验:分类学上分为界、门、纲、目、科、属、种,还有人为定义的OTU,到底在那一层面进行Venn图比较。选择的原则是先用OTU,如果没有发现很好重叠,很可能是在更高级别分类水平的功能重叠,从底层属向上尝试。本研究是找到科水平有较好一致结果。

图注原文:
Fig. 1. Defense phytohormone mutants have altered root bacterial communities compared to wild-type plants. (A) Jasmonic acid (JA), salicylic acid (SA), and ethylene mutants (names at left) derived from wildtype Col-0. Upward and downward black arrows at right, hyper- and hypo-immune mutants, respectively. (B) Phyla distributions were separated into sample fractions (Soil, Col-0 Rhizosphere, R, or Endophytic Compartment, EC) and plant genotypes. Shannon Diversity indices are listed above each bar. * indicates a phylum significantly lower than Col-0 EC at p<0.001; # indicates a phylum significantly higher than Col-0 EC at p<0.05; ^ indicates that JEN, EN, and NJ Firmicutes relative abundances were significantly lower than Col-0 EC at p<0.04; @ indicates Shannon Diversity Index significantly lower than Col-0 EC at p<0.001 (all ANOVA with post hoc Tukey test). (C) The phyla distribution (circles color-coded as in B) of bacterial families identified as either enriched or depleted in ECs of each mutant compared to Col-0. The number of families in each category is noted inside each donut. Groups defined by Monte Carlo testing of Manhattan distances. (D) Venn diagram showing the overlap of enriched (left) or depleted (right) Group 2 families from (B).

Reference

  1. http://baike.baidu.com/item/%E6%96%87%E6%B0%8F%E5%9B%BE
  2. https://zh.wikipedia.org/wiki/%E6%96%87%E6%B0%8F%E5%9B%BE
  3. http://mp.weixin.qq.com/s/zn654JqG9OeO71rJUTDr2Q
  4. Edwards, J., et al. (2015). “Structure, variation, and assembly of the root-associated microbiomes of rice.” Proceedings of the National Academy of Sciences 112(8): E911-E920.

本文其它链接地址 CSDN“宏基因组”公众号阅读;

想了解更多宏基因组、16S文献阅读和分析相关文章,快关注“宏基因组”公众号,干货第一时间推送。
image

系统学习生物信息,快关注“生信宝典”,那里有几千志同道合的小伙伴一起学习。
image

### 回答1: 扩增子分析流程是一种用于分析环境样品中微生物群落的方法,常用于研究微生物的多样性、结构和功能。QIIME 2是一款流行的用于扩增子分析的开源软件包,它提供了丰富的工具和流程来处理和分析扩增子数据。 QIIME 2的分析流程通常包括以下主要步骤: 1. 数据预处理:首先,需要对原始的扩增子测序数据进行质控和过滤,以去除低质量的序列和嵌入式引物。 2. 物种注释:对过滤后的序列进行比对,使用参考数据库(如Greengenes和Silva)进行物种注释,以确定每个序列的分类学归属。 3. 生成特征表:利用序列分类结果,将每个样品的序列计数编码到一个特征表中,该表记录了每个物种或OTU(操作分类单位)在每个样品中的相对丰度。 4. Alpha多样性分析:通过计算各个样品的Alpha多样性指数,如物种丰富度和均匀性指数,来评估样品内部的多样性。 5. Beta多样性分析:通过计算样品间的Beta多样性距离,如Bray-Curtis和Jaccard距离,来比较样品之间的微生物群落差异,并可视化为PCoA(主坐标分析)。 6. 群落结构分析:使用各种统计方法,如ANOVA(方差分析)和PERMANOVA(多变量方差分析),来检测具有显著差异的物种或OTU,并识别对样品群落结构有影响的因素。 7. 功能预测:利用功能预测软件,如PICRUSt和Tax4Fun,根据扩增子数据中的物种注释信息,推断微生物群落的功能组成。 总之,QIIME 2是一种功能强大的工具,可以帮助研究人员从扩增子测序数据中获取丰富的信息和洞察力,并在微生物生态学、生物地球化学和医学等领域有着广泛的应用价值。 ### 回答2: QIIME2是一种用于从高通量测序数据中进行微生物群落分析的开源软件。扩增子分析流程是QIIME2中的一个重要模块,用于处理和分析扩增子测序数据。 扩增子分析流程主要分为以下几个步骤: 1. 数据准备:将测序生成的原始数据导入QIIME2,并进行质量控制和序列去噪。这一步骤包括对测序错误进行校正和剔除低质量序列。 2. 物种注释:通过比对序列数据库(如Greengenes或Silva)将序列注释为对应的物种或OTU(操作性分类单元)。这一步骤可以帮助了解样本中存在的微生物种类和丰度。 3. Alpha多样性分析:计算样本内的多样性指数,如Shannon指数和Simpson指数,用于评估微生物群落的多样性程度。该分析可以显示样本内微生物的丰富度和均匀性。 4. Beta多样性分析:计算样本间的多样性差异,并进行聚类分析或PCoA(主坐标分析)来展示样本间的相似性和差异性。这一步骤可以帮助分析群落结构的相似性和差异性。 5. 物种组成分析:通过计算不同样本间的物种组成差异,使用统计学方法(如ANOVA或PERMANOVA)来鉴定群落结构差异的显著性。这一步骤可以帮助了解不同条件下微生物群落的变化。 6. 功能预测:根据16S rRNA序列或ITS序列的相对保守性,通过推断出的物种信息,对微生物群落的功能进行预测,并探索样本中存在的功能差异。 通过上述步骤,扩增子分析流程可以帮助研究人员了解微生物群落的组成、丰度、多样性和功能,从而探索微生物与宿主或环境的相互作用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值