测序数据分析之OTU

1. OTU(Operational Taxonomic Units)操作分类单元:是在是在系统发生学研究或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设置的同一标志。在生物信息分析中,一般来说,测序得到的每一条序列来自一个菌。要了解一个样品测序结果中的菌种、菌属等数目信息,就需要对序列进行归类操作(cluster)。通过归类操作,将序列按照彼此的相似性分归为许多小组,一个小组就是一个OTU。通常按97%的相似度,对所有序列进行OTU划分并进行生物信息统计分析。

通常在97%的相似水平下聚类生成OTU,近期认为100%更合理。

选择每个聚类群众最高丰度序列作为代表性序列。

为什么需要OTU?

序列错误:PCR产生的错误;测序错误

菌内16S多样性

计算能力和算法限制,两两比较太耗时

 

优点:快速生成丰度矩阵

不足:只到属水平;菌和OTU无法对应;不同批次实验无法比较

2.扩增子实验和分析流程

 简言之,基本思路为:质控-挑选代表序列(OTU/ESV)-物种注释-生成Feature表-多样性分析(整体)-差异比较(局部)-机器学习

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值