比较早整理,很多参考链接没能全附上
微生物组学
是指研究动植物体上共生或病理的微生物生态群体。微生物组包括细菌、古菌、原生动物、真菌和病毒等。研究表明其在宿主的免疫、代谢和激素等方面非常重要。
Microbiome 微生物群
微生物群是指研究动植物体上共生或病理的微生物生态群体。微生物群包括细菌、古菌、原生动物、真菌和病毒。研究表明其在宿主的免疫、代谢和激素等方面非常重要。近义词Microbiome微生物组即包括微生物,又包括其基因组。
Metagenomics 宏基因组
宏基因是指直接研究环境样品作为遗传学材料(环境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因,目前主要指环境样品中的细菌和真菌的基因组总和)。广义来説其包括环境基因组、生态基因组学和群体基因组学。
Microbiome 微生物组
WiKi认为其与Microbiota同义,均为Microbiota词条。但其实这两个词区别还是很有的,看下图(区分 研究对象)
扩增子测序
16S的结构
16S rRNA位于原核细胞核糖体小亚基,包括10个保守区和9个 高变区,保守区在细菌间的差异不大,高变区具有属和种特异性。
16rDNA 扩增子测序,通常选择1~2个高变区域,利用保守区设计通用引物进行PCR 扩增,然后对高变区进行测序分析和菌种鉴定。
16S单V4区、V3-V4区是最佳选择?
其中V4区是指第四个可变区,一般是指515~806bp这个区域,IBD。而V3-V4区是指第三和第四两个可变区,一般是指341~805bp这个区域,长度约为460bp。
长度代表了什么?代表了可用于鉴别物种的信息位点。长度越长,可用于反映细菌亲缘关系的位点数越多。
为什么扩增子有barcode
扩增子目前研究对象细菌、真菌多样性没有表达基因数量大,一般是几百到千的水平,对数据量要求最多10万条序列即可饱合。因此将扩增子样本添加上barcode(标签),通常将48/60个样品混合在一起,构建一个测序文库,达到高通量测序大量样品同时降低实验成本的目的。
16s 适用于物种的鉴定的原因:
1、既有高度保守的序列区域,又有中度,和高变的序列区域,适用于进化距离不同的各类生物亲缘关系的研究
2、分子大小适中,便于序列分析 ,1540bp
3、普遍存在,含量大
为什么要去冗余?
因为原始序列几百万条,聚类计算的时间极其恐怖。而已知扩增子测序结果中序列重复度高,并且大量出现1次或几次的序列统计学和功能上意义不大。因此将几百万条序列去冗余,并过滤低丰度序列,一般只剩几万条,极大的减少了下游分析的工作量,并可使结果更容易理解。
OTU(operational taxonomic units),即操作分类单元。通过一定的距离度量方法计算两两不同序列之间的距离度量或相似性,继而设置特定的分类阈值,获得同一阈值下的距离矩阵,进行聚类操作,形成不同的分类单元。
为什么要聚类OTU?
是因为Unique的序列仍然远多于物种数量,并且扩增的物种可能存在rDNA的多拷贝且存在变异而得到来自同一物种的多条序列扩增结果。目前人为定义序列相似度通常97%以上为OTU,大约是物种分类学种的水平,实际上1个OTU可能包括多个物种,而一个物种也可能扩增出多个OTU
OTU在16S测序中有何用?
在16S分析中引入OTU,首先对相似性序列进行聚类,分成数量较少的分类单元,基于分类单元进行物种注释。
OTU如何聚类?
OTU聚类的方法多种多样,如Uclust、cd-hit、BLAST、mothur、usearch和 prefix/suffix,这些聚类方法均可以在QIIME软件中实施。不同聚类方法基于不同的算法,得到的聚类结果虽然不同,但是大体的聚类流程都是一致的
OTU跟物种的关系
OTU聚类后,挑选出每个OTU中的代表序列,与RDP、Sliva或GreenGene等数据库进行比对,进行物种注释。
1、Alpha多样性简介
Alpha多样性是指通过单样本的多样性分析反映样品内的微生物群落的丰富度和多样性,通常有测序深度指数(Observed spieces 和Good’s coverage)、菌群丰度(Chao1和ACE)和菌群多样性指数(shannon和simpson)。
2、Beta多样性简介
Beta多样性指不同生态系统之间多样性的比较,是物种组成沿环境梯度或者在群落间的变化率。通常PCoA分析和聚类分析。聚类分析中主要有bray curtis距离 和Unifrac距离方法。Bray Curtis距离基于OTU的群落比较方法,其优势在于算法简单,考虑物种丰度(有无)和均度(相对丰度),但其没有考虑OTUs之间的进化关系。Unifrac距离是根据系统发生树进行比较,一般有加权和非加权分析。
宏基因组 ( Metagenome)
环境中全部微小生物遗传物质的总和。它包含了可培养的和不可培养的微生物的基因,目前主要指环境样品中的细菌和真菌的基因组总和。
16S和宏基因组有什么不同
★ 测序原理不同
16S rDNA是细菌分类学研究中最常见的“分子钟”,具有高度的保守性。该序列包含9个高变区和10个保守区,通过对某一段高变区序列(如V4区或V3-V4区)进行PCR扩增后进行测序,得到 200 - 400 bp 左右的序列。
宏基因组测序和常规DNA文库一样,将微生物基因组DNA随机打断成小片段,然后在片段两端加入接头进行高通量测序。
★ 研究领域不同
16S测序主要研究群落的物种组成、物种间的进化关系以及群落的多样性。而宏基因组测序还可以进行基因和功能层面的深入研究。
★ 物种鉴定程度不同
16S测序得到的序列很多注释不到种水平,而宏基因组测序则能鉴定微生物到种水平甚至菌株水平。16S rDNA尽管高变区具有很高的特异性,但是某些物种(尤其是分类水平较低的种水平)在这些高变区可能非常相近,能够区分它们的特异性片段可能不在扩增区域内,导致无法进一步区分。而宏基因组测序通过对微生物基因组随机打断,并通过组装将小片段拼接成较长的序列。因此,在物种鉴定过程中,宏基因组测序具有较高的优势。
宏基因组基础知识梳理 : https://mp.weixin.qq.com/s/d-cmrrnFlI8gOBQtKLHxWw
微生物群落多样性测序与功能分析 : https://jingyan.baidu.com/article/0964eca212f6a88284f53675.html