checkv的基本使用

目录

1.checkv运行的的步骤

A: Remove host contamination

B:Estime genome completeness

C:Predict closed genomes

D:Summarieze quality

2.下载与安装checkv

checkv基于conda的环境

3.checkv的基本使用

一步法

分步法

4.checkv的运行的过程

5.checkv的结果解读

 quality_summary.tsv(三个模块的综合输出)

provirus/virus、质量、完整度

 virus.fna

这里的virus序列可能是游离病毒的,也可能是前病毒的一部分

provirus.fna

checkv对provirus序列切割后的产物,provirus region / contig sequence

contamination.tsv

checkv会进一步鉴定所有序列中的host污染及位置信息,关于估计污染的详细概述

 tmp/proteins.faa

病毒蛋白序列信息

completeness.tsv

关于估计完整性的详细概述

 complete_genomes.tsv

已确定的假定完整基因组的详细概述


1.checkv运行的的步骤

A: Remove host contamination

B:Estime genome completeness

C:Predict closed genomes

D:Summarieze quality

2.下载与安装checkv

checkv基于conda的环境

conda install -c conda-forge -c bioconda checkv
#数据库下载(自动)
checkv download_database ./
#数据库下载(手动)
wget https://portal.nersc.gov/CheckV/checkv-db-v1.0.tar.gz
tar -zxvf checkv-db-v1.0.tar.gz
export CHECKVDB=/path/to/checkv-db-v1.0

3.checkv的基本使用

一步法

checkv end_to_end input_file.fna output_fiel -t -16

分步法

checkv contamination input_file.fna output_directory -t 16
checkv completeness input_file.fna output_directory -t 16
checkv complete_genomes input_file.fna output_directory
checkv quality_summary input_file.fna output_directory

4.checkv的运行的过程

CheckV v0.8.1: contamination
[1/8] Reading database info...
[2/8] Reading genome info...
[3/8] Calling genes with Prodigal...
[4/8] Reading gene info...
[5/8] Running hmmsearch...
[6/8] Annotating genes...
[7/8] Identifying host regions...
[8/8] Writing results...
Run time: 128.65 seconds
Peak mem: 0.12 GB

CheckV v0.8.1: completeness
[1/8] Skipping gene calling...
[2/8] Initializing queries and database...
[3/8] Running DIAMOND blastp search...
[4/8] Computing AAI...
[5/8] Running AAI based completeness estimation...
[6/8] Running HMM based completeness estimation...
[7/8] Determining genome copy number...
[8/8] Writing results...
Run time: 28.43 seconds
Peak mem: 0.25 GB

CheckV v0.8.1: complete_genomes
[1/7] Reading input sequences...
[2/7] Finding complete proviruses...
[3/7] Finding direct/inverted terminal repeats...
[4/7] Filtering terminal repeats...
[5/7] Checking genome for completeness...
[6/7] Checking genome for large duplications...
[7/7] Writing results...
Run time: 0.13 seconds
Peak mem: 0.25 GB

CheckV v0.8.1: quality_summary
[1/6] Reading input sequences...
[2/6] Reading results from contamination module...
[3/6] Reading results from completeness module...
[4/6] Reading results from complete genomes module...
[5/6] Classifying contigs into quality tiers...
[6/6] Writing results...
Run time: 0.04 seconds
Peak mem: 0.25 GB

5.checkv的结果解读

 quality_summary.tsv(三个模块的综合输出)

provirus/virus、质量、完整度

 virus.fna

这里的virus序列可能是游离病毒的,也可能是前病毒的一部分

provirus.fna

checkv对provirus序列切割后的产物,provirus region / contig sequence

contamination.tsv

checkv会进一步鉴定所有序列中的host污染及位置信息,关于估计污染的详细概述

 tmp/proteins.faa

病毒蛋白序列信息

completeness.tsv

关于估计完整性的详细概述

 complete_genomes.tsv

已确定的假定完整基因组的详细概述

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值