Mothur4_评估错误率

本文详细介绍了如何利用Mothur软件来评估测序错误率。通过提取Mock样本的序列并进行seq.error命令计算,得出错误率为0.0065%。接着,对序列进行聚类分析,发现在无嵌合体和错误的理想情况下,应有20个OTU,但实际检测到35个,表明存在隐形嵌合体和错误。该过程有助于监控项目进展和测序质量。
摘要由CSDN通过智能技术生成

本文主要介绍生物信息学软件 Mothur评估错误率。

Mothur评估错误率

测量自己序列的错误率,是在有了一个模拟群落的共同序列后才能做的事情。提供的序列的每95个样本,都做了同样的工作(This is something we include for every 95 samples we sequence)。我们也应该如此,因为它可以帮助衡量错误率,了解项目进展情况(allow you to see how well your curation is going)以及测序设置是否有问题。首先使用get.groups命令从“Mock”样本中提取序列:

注意:如果在Windows机器上运行此分析,由于make.file命令创建组名的方式,Mock组名可能会大写,需要设置groups=MOCK。

mothur>get.groups(count=stability.trim.contigs.good.unique.good.filter.unique.precluster.denovo.vsearch.pick.pick.count_table,fasta=stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.fasta, groups=Mock)

从以上结果看出,Mock样本中有64个唯一序列,总共4048个序列。现在可以使用seq.error命令来测量错误率:

mothur>seq.error(fasta=stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.fasta,count=stability.trim.contigs.good.unique.good.filter.unique.precluster.denovo.vsearch.pick.pick.pick.count_table, reference=HMP_MOCK.v35.fasta, aligned=F)

结果显示错误率是0.0065%。现在可以将序列聚类到OTU中,以查看有多少个伪OTU:

mothur>dist.seqs(fasta=stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.fasta, cutoff=0.03)

mothur>cluster(column=stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.dist,count=stability.trim.contigs.good.unique.good.filter.unique.precluster.denovo.vsearch.pick.pick.pick.count_table)

mothur>make.shared(list=stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.opti_mcc.list,count=stability.trim.contigs.good.unique.good.filter.unique.precluster.denovo.vsearch.pick.pick.pick.count_table, label=0.03)

mothur>rarefaction.single(shared=stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.opti_mcc.shared)

此命令字符串将生成一个名为stability.trim.contigs.good.unique.good.filter.unique.precluster.pick.pick.pick.opti_mcc.groups.rarefaction的文件。打开它会看到,对于4048个序列,有35个来自Mock群落的OTU。这个数字当然包括一些没有被检测到的隐形嵌合体。如果使用3000个序列,则大约有31个OTU。在没有嵌合体且无测序错误的完美世界中,将拥有20个OTU。

这篇推文对你有帮助吗?喜欢这篇文章吗?喜欢就不要错过呀,关注本知乎号查看更多的环境微生物生信分析相关文章。亦可以用微信扫描下方二维码关注“环微分析”微信公众号,小编在里面载入了更加完善的学习资料供广大生信分析研究者爱好者参考学习,也希望读者们发现错误后予以指出,小编愿与诸君共同进步!!!

学习环境微生物分析,关注“环微分析”公众号,持续更新,开源免费,敬请关注!

转载自原创文章:

Mothur4_评估错误率​mp.weixin.qq.com/s/yu8YSxxYt757SUC73jRyhA

最后,再次感谢你阅读本篇文章,真心希望对你有所帮助。感谢!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值