干货学习|一文解答微生物多样性常见问题

1.是否需要生物学重复,多少个合适?

答:为保证数据质量、结果产出及顺利投稿,必须注意生物学重复问题。考虑到个体差异、后期组间统计学分析以及偏离样本,自然环境至少3个生物学重复,推荐5个及以上重复,以便于剔除偏离样本;若是人类的肠道、粪便等样品,由于个体特异性高,建议10个以上的重复。

从严格的角度来讲,最好能够整批样品同时测序分析,既可以减少不同批次间的系统误差,还能节省项目周期,若样品准备有困难,也可以分批次启动,可能会有批次效应但一般不会带来显著影响。

 2.微生物多样性是否能鉴定到种或者属?二代和三代扩增子有什么区别? 

答:二代扩增子测序一般情况可以鉴定到属,三代扩增子是测菌的全长,信息量更多一些,有一些微生物可以精确到种的信息,但是个别亲缘关系很近的,不一定能区分。

二代和三代扩增子的区别:1)测序平台,全长测序使用三代测序平台,基于PacBio或者Nanopore等测序平台测序;二代测序使用的是illumina或者华大平台等;2)测序区段,二代扩增子只选择1-2个高变区进行测序,三代则测16S/18S/ITS全长序列;3)物种鉴定准确度,全长可变区信息较多,相对二代来说可提高物种鉴定的分辨率,提高群落组成的鉴定的精度,更加真实的还原样本中微生物群落结构。

3.普通扩增和巢式扩增有什么区别?巢式扩增会不会影响上机?

答:巢式PCR是指利用两套PCR引物进行两轮PCR扩增,第二轮的扩增产物为目的基因片段。第一步:DNA模板与第一对引物结合,得到第一轮的扩增产物;第二步:以第一轮的扩增产物为模板,使用第二轮引物进行第二轮PCR扩增,得到目的片段。

作用:用于微生物量低的样本,常见临床样本或者植物内生菌的扩增,目的是提高目标序列在样本中的丰度,巢式的结果不影响上机,但是需要注意如果是同批样本一起分析,建议统一扩增方法,避免不同扩增方法引起的误差。

 4.微生物多样性与宏基因组如何选择? 

答:目前来说,16S常用来分析菌群的群落,物种的组成,多样性分析等,但是由于16S测序(16S仅对16S区域进行测序无法获得基因组上的基因序列)仅能做物种层面的分析,如果想要研究具体的功能和基因,推荐选择宏基因组。

宏基因组研究以环境中所有微生物基因组为研究对象,通过对环境样品中的全基因组DNA进行高通量测序,然后基于denovo组装进行微生物群落结构多样性,微生物群体基因组成及功能,特定环境相关的代谢通路等分析,从而进一步发掘和研究具有应用价值的基因及环境中微生物群落内部、微生物与环境间的相互关系。构建的环境微生物基因集,可为环境中微生物的研究、开发和利用提供基因资源库。

总而言之,(1)16S相对于宏基因组性价比高很多,如果研究经费有限可以选择16S测序;(2)如果仅关注物种的组成,物种多样性分析等方面分析,不涉及功能和基因层面,16S测序就足够了,想要进行功能和基因层面研究(如代谢通路、抗性基因等)则可选择宏基因组;(3)宏基因组相对于16S还有一个优势,就是可以通过组装和分箱技术获得单个细菌的基因组,这对于难分离培养细菌极其有用;(4)在经费有限的情况下,如果既想要物种层面研究,也想要进行功能和基因层面研究,可以选择16S+宏基因组的组合方式,大样本量做16S,从中选择一个小样本量子集做宏基因组;(5)在样本制备阶段,某些特殊样本无法去除真核宿主DNA,这时候选择16S测序可以有效避免真核宿主污染。

5.OTU和ASV分别是什么,我们应该如何选择?

答:扩增子测序是微生物组分析最常用的手段,分析流程也相对比较成熟。扩增子测序分为两个步骤:PCR扩增和测序。这两个步骤都会带来碱基错配,从而导致最后测序数据里面存在比较多的错误。如果一条特定的序列代表了一个微生物,那么存在错误的序列就会造成假阳性。OTU和ASV是解决这一问题应用最广的两种不同分析策略。

OTU:(1)早期算法,历史悠久,应用较广;(2)OTU聚类算法是将相似性大于97%的序列聚为一类,聚类的原则是将低丰度序列往高丰度的序列上聚类。因为测序错误是随机产生的,所以低丰度的序列可能是测序错误导致的,而高丰度序列被认为是准确率更高的序列,这种算法可以将操作分类单元中包含的碱基错误率控制在1%以内;(3)但是这种方法忽略了真实的微生物序列变化,对于一些高度相似的不同种微生物很可能会被整合到单个OTU中,所以相较于ASV,OTU的物种分辨率更低,可能存在低估样本真实的物种多样性的风险;

ASV:(1)近些年来发展出来的新算法,后起之秀;(2)ASV的方法则不直接进行聚类,它是基于统计学的手段对序列纠错,纠错后的序列称为ASVs(Amplicon Sequence Variants)。该方法引入了扩增和测序错误,来推断样本中的扩增子序列,以低至一个碱基的差异来区分序列,可以最大限度的保留了序列的物种多样性,也可以将ASV变相理解为100%聚类的OTU;(3)与OTU相比,ASV具有更高的分辨率,并显示出更好的特异性和更低的假序列率,这对较低的种属分类水平影响较大,而对较高的分类学水平(门水平)组成的影响较小,ASV能够使得环境因子对微生物群落能够获得更高的解释度,因而对于物种信息更为复杂的环境样品建议采用ASV划分方式;(4)由于基因组内部不同16S rRNA基因拷贝的异质性,可能会有多样性高估偏差;(5)此外,在样本的物种多样性很高且测序数据量或者采样量不足情况下,ASV方法会产生更多的低丰度ASV,在后续分析中默认统一去除单件(即在全部样品中仅出现1次的ASV/OTU),因此ASV方法可能会存在较高的数据损失。

6.为什么同一个物种对应不同的OTU?

答:①在数据库中,本身就存在相同的物种,不同序列的情况。

②OTU是以97%的相似度去聚类的,即使是相同的物种,序列也有可能有个别碱基的不同,加之设定比对置信区间为80%,注释的时候也都会注释上相同的物种。

7.在计算微生物群落样品之间的距离时,分别基于加权与非加权两种不同的算法绘制出的结果展示图有什么不同?如何进行选择呢?

答:①利用非加权的计算方法,主要比较的是物种的有无,如果两个群体的B多样性越小,则说明两个群体的物种类型越相似;而加权方法,则需要同时考虑物种有无和物种丰度两个层面。

②非加权距离算法对稀有物种比较敏感,而加权距离算法则对丰度较高的物种更加敏感。如果研究的生物学问题与物种的相对丰度信息密切相关,使用加权算法的结果展示可能更为符合;如果研究的生物问题与丰度关系不密切,或者各组的区分与低丰度的 OTUs更为密切,则使用非加权的结果可能更为合适。

 8.环境因子的数目过多的时候,如何对环境因子做筛选? 

答:在进行环境因子关联分析的时候,通常我们会有很多个不同的环境因子,但不是所有的环境因子都会对微生物群落产生实际的影响,尤其是当环境因子的数目过多的时候,部分无意义的环境因子可能还会影响最终的结果。因此,在进行环境因子关联之前,首先要对这些环境因子进行一个初步的筛选,剔除掉一些无效的因子。

VIF分析是针对所有环境因子进行共线性分析,最后会给出每个环境因子的得分,VIF分析通常以10作为阈值,当VIF得分大于10的时候,通常意义上就认为这个环境因子是无效的,可以从后续的分析中剔除。

9.我们在文章中经常会发现,有些研究使用的是RDA,而有些研究使用的是CCA,那么到底这两种方法如何选择呢?

答:RDA 或 CCA 选择原则:先用 species-sample做 DCA 分析,根据DCA分析结果中的梯度长度指标进行选择,看分析结果中 Lengths of gradient 的第一轴的大小,如果大于4.0,就应选CCA;如果在3.0-4.0之间,选RDA 和CCA 均可;如果小于3.0,RDA 的结果要好于 CCA,即选择RDA。

10.抽平和不抽平的区别?

  • 抽平指按照一定数量或样本序列最低数量,将所有样本的序列随机抽取至统一数据量。 简单地说,就是在不同的样本测序数据有差距的时候,保证样本测序序列的均一性;
  • 抽平分析对高丰度的菌群影响不大,但对于低丰度的物种影响较大,如果关心低丰度菌群则不建议抽平;如果关心高丰度菌群,则抽不抽平都可以;
  • 另外,有些杂志要求抽平,具体可参考意向杂志的发表的同类文章,关注分析是否抽平,如同类文章几乎都抽平,可推断大概率需要抽平,如没有规律则抽不抽平均可。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值