RGI:CARD库注释抗性基因

GitHub - arpcard/rgi: Resistance Gene Identifier (RGI). Software to predict resistomes from protein or nucleotide data, including metagenomics data, based on homology and SNP models.

mamba create -n rgi
mamba activate rgi
mamba search --channel conda-forge --channel bioconda --channel defaults rgi
mamba create --name rgi --channel conda-forge --channel bioconda --channel defaults rgi
# OR
mamba install --channel conda-forge --channel bioconda --channel defaults rgi=6.0.3

mkdir CARD_db
cd CARD_db
wget https://card.mcmaster.ca/latest/data
tar -xvf data ./card.json
rgi load --card_json ./card.json --local

使用

cd work_path
rgi load --card_json ./card.json --local
# 核酸注释contigs水平
rgi main --input_sequence /path/to/nucleotide_input.fasta --output_file /path/to/output_file --local --clean --include_loose --num_threads 80
#  --include_loose 是宽松比较,如果需要严格一点,可以使用--include_nudge。 如果这两个参数都不加,应该是最严格的
# 默认使用blast,需要更快的比对可以增加 -a DIAMOND 参数
# 宏基因组数据中,建议添加 --low_quality 参数(如果选择了低序列质量选项,RGI 将使用 Prodigal 匿名模式进行开放阅读框预测,支持从短或低质量重叠群中调用部分 AMR 基因)

#蛋白 不使用diamond,似乎得到的结果会多一点
rgi main --input_sequence /path/to/protein_input.fasta --output_file /path/to/output_file --local --clean -t protein  --num_threads 80 -a DIAMOND 

输出解释

ORF_ID: Piromyces_2569
表明检测到的 ORF(开放阅读框)编号。

Start 和 Stop: 起始和终止位置,这里未提供具体的值,可能因为不是从全基因组数据中提取的序列。

Orientation: 基因方向信息(未显示,可能默认正向)。

Cut_Off: Strict
指定匹配阈值,这里是严格(strict)模式,表示该抗性基因的注释达到了严格预测的要求。

Best_Hit_Bitscore 和 Pass_Bitscore:

Best_Hit_Bitscore: 21.9422
比对得分,用于衡量该序列与参考抗性基因的相似程度。分值越高,匹配越可靠。

Pass_Bitscore: 500
这是检测通过的最低阈值,与实际比对得分比较(这里表明比对得分低于阈值)。

Best_Hit_ARO: OXA-1228
表明最佳匹配的抗性基因是 OXA-1228。这是一个 OXA 型 β-内酰胺酶,与 β-内酰胺类抗生素(如青霉素和碳青霉烯类)的抗性相关。

ARO: 3008638
Antibiotic Resistance Ontology (ARO) ID,用于在 CARD 数据库中唯一标识该抗性基因。

Drug Class: carbapenem; penicillin beta-lactam
该基因赋予对 碳青霉烯类 和 青霉素类 β-内酰胺抗生素 的抗性。

Resistance Mechanism: antibiotic inactivation
该基因通过“抗生素失活”机制赋予抗性,通常通过水解抗生素分子。

AMR Gene Family: OXA beta-lactamase; OXA-62-like beta-lactamase
所属的抗性基因家族,包括 OXA β-内酰胺酶和与 OXA-62 类似的 β-内酰胺酶。

Predicted_DNA 和 Predicted_Protein:

Predicted_DNA 提供核苷酸序列,
如 GYHEYQFDINQYIKNNNMVLTDGTSCYPCYGETNRIASFTHWIIICSKFSELK*。

Predicted_Protein 提供翻译的氨基酸序列。


CARD_Protein_Sequence:
CARD 数据库中的参考蛋白序列,可用于进一步分析基因功能。

Percentage Length of Reference Sequence: 18.49
该序列覆盖参考抗性基因的比例(18.49%),说明匹配区域较短。

Nudged: TRUE
表示该基因注释结果通过 "Nudge" 策略进行了调整,尽管严格模式未完全满足,但匹配接近严格模式要求。

Note: loose hit with at least 95 percent identity pushed strict
表明该基因匹配结果属于宽松命中(loose hit),但因为匹配身份(identity)超过 95%,被调整为严格命中(strict hit)。

Antibiotic: oxacillin
该基因与 oxacillin(苯唑西林) 抗性相关。这是 β-内酰胺类抗生素的一种。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值