CheckM-Options-zn

CheckM是一种用于评估宏基因组组装bin质量的工具,通过比较单拷贝基因集来计算完整度和污染度。推荐使用lineage_wf方法,涉及的命令包括checkm lineage_wf -h等。其工作流程包括背景、建立进化树、计算质量指标等,常用的质量标准是污染度<10%和完整度>80%。
摘要由CSDN通过智能技术生成

CheckM的GitHub官网

CheckM英文帮助文档

参考链接

CheckM (宏)基因组质量评估

国家微生物科学数据中心-CheckM使用说明内有视频及PDF讲解,还可线上测试。

Background

CheckM首先基于完整的已测序细菌基因组作为参考基因组,构建基因组的进化树,构建每个谱系(可以理解为一类物种)的单拷贝基因集(管家基因)(single copy genes,SCGs,为什么是单拷贝?因为这样可以开展基因组混合程度、污染程度等的评估)。在使用时,将我们的Bin与参考基因组一起建树,基于进化关系找到Bin的参考物种,然后结合参考物种的单拷贝基因集,计算两个重要指标

Completeness,完整度,Bin基因与对应SCGs相比,基因数量是否完整,取值[0,100%],数值越大,表示Bin质量越好; Contamination,污染度,Bin基因包含多个物种的SCGs,即一个Bin存在多个物种的程度,取值[0,100%],数值越小,表示Bin质量越好。

获得每个bin的污染度、完整度信息后,挑选高质量的bin进行物种、功能注释。再后续分析中,并没有固定标准。需要的数量多,则放宽阈值;需要的数量少,则提升阈值。其中,最常用的指标是污染度小于10%,且完整度大于80%。大家可以在这个基础上上下调整。

得到了组装的bin的数据,CheckM下载完成,开始分析

CheckM的工作流程

lineage-specific(世系特异性)【推荐方法】

checkm lineage_wf <bin folder> <output folder>
##根据基因组在参考基因组发育树中的位置,来推断它的single-copy基因集,需要有checkM的数据库

taxonomic-specific(物种分类特异性)

checkm taxonomy_wf <rank> <taxon> <bin folder> <output folder> <rank>: phylum; <taxon> : Cyanobacteria
##自己知道自己的数据来自哪个门,什么科的
  1. custom marker genes(自行指定基因maker)
checkm analyze <custom HMM file> <bin folder> <output folder>
checkm qa <custom HMM file> <output folder>
##自己预测了基因maker,<custom HMM file>就是预测的结果
<
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
dRep checkm是dRep软件中的一个命令,用于检查基因组的完整性和质量。在运行dRep checkm命令时,会检查一些依赖软件的安装情况,如mash、nucmer、ANIcalculator、centrifuge、nsimscan和fastANI。如果这些软件没有正确安装或位置不正确,dRep checkm命令会显示错误信息。\[1\] 另外,在dRep中还有其他一些命令可以用于去除基因组目录中的冗余。例如,可以使用dRep dereplicate命令以一定的ANI阈值对基因组进行聚类,并将相似度较高的基因组放入物种级别的次要集群。要去冗余基因组,可以使用以下命令:dRep dereplicate -p {threads} {params.outdir} -g {params.indir}/*.fa -pa 0.90 -sa 0.95 -nc 0.30 -cm larger --genomeInfo {input.checkm} -comp 50 -con 5。其中,pa参数表示主要集群的ANI阈值,sa参数表示次要集群的ANI阈值。\[2\] 此外,还可以使用bwa和samtools等工具对基因组进行比对和排序。例如,可以使用bwa mem命令将基因组比对到参考序列上,并使用samtools进行排序和索引。具体命令如下:bwa index {input.catalog}、bwa mem -t {threads} {input.catalog} {input.fwd} {input.rev} | samtools view -bS - | samtools sort -@ {threads} -o {params.alignedsorted}、samtools index {params.alignedsorted}、samtools flagstat {params.alignedsorted} > {output.flagstat}。\[3\] #### 引用[.reference_title] - *1* [dRep学习笔记](https://blog.csdn.net/dunghill_cock/article/details/124682718)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [Nature子刊:宏基因组中挖掘原核基因组的分析流程](https://blog.csdn.net/woodcorpse/article/details/118124686)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

cling5899

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值