使用PhaGCN2(v2.2)对病毒重叠群进行物种分类注释

PhaGCN2 是一个基于 GCN 的模型,它可以通过深度学习分类器学习物种掩蔽特征,用于新的病毒分类注释。要使用 PhaGCN2,您只需将重叠群输入程序即可。PhaGCN2 数据库现已根据最新的ICTV分类表进行了更新。

下载安装

首先进入GitHub - KennthShang/PhaGCN2.0,如下图所示,点击绿色Code,下载如图所示的ZIP文件。

然后把此文件上传到自己服务器目录,使用unzip命令解压此文件:unzip PhaGCN2.0-main

进入此目录:cd PhaGCN2.0-main

创建新环境:conda env create -f environment.yaml -n phagcn2

准备数据库:cd database

                     tar -zxvf ALL_protein.tar.gz

返回PhaGCN2.0-main目录: cd ..

运行

每次使用前,在PhaGCN2.0-main目录下运行如下命令:

conda activate phagcn2
export MKL_SERVICE_FORCE_INTEL=1
python run_Speed_up.py --contigs contigs.fa --len 8000

参数说明

该程序有两个参数:

  1. --contigs是重叠群文件的路径。
  2. --len是要预测的重叠群的长度。 如我们的论文所示,随着重叠群长度的增加,召回率和精度增加。我们建议您根据需要选择合适的长度。默认长度为 8000bp。 支持的最短长度为 1700bp。输出文件final_prediction.csv。此 csv 文件中有三列:“contig_name、median_file_name、预测”。
  3. 输出文件就在PhaGCN2.0-main目录下

注意:

如果要使用 PhaGCN,需要注意三件事:

  1. 确保所有重叠群都是病毒重叠群。您可以使用 VirSorter 或 DeepVirFinder 对细菌重叠群进行筛选
  2. 该脚本将传递具有非 ACGT 字符的重叠群,这意味着这些非 ACGT 重叠群将保持不可预测状态。
  3. 如果程序输出错误(由您的机器引起):错误:mkl-service + Intel(R) MKL: MKL_THREADING_LAYER=INTEL 与 libgomp.so.1 库不兼容。 您可以在运行run_Speed_up.py之前键入命令export MKL_SERVICE_FORCE_INTEL=1
  4. 如果要训练自己的病毒分类数据库,硬件要求可能相当大(超过 48 GB,至少一个 GPU),主要取决于数据集的大小和复杂程度。(内存需求与即将分析的序列之间的关系)。此部分在作者GitHub上有详细介绍。

参考资料

GitHub - KennthShang/PhaGCN2.0

Jiayu Shang, Jingzhe Jiang, Yanni Sun, Bacteriophage classification for assembled contigs using graph convolutional network, Bioinformatics, Volume 37, Issue Supplement_1, July 2021, Pages i25–i33, https://doi.org/10.1093/bioinformatics/btab293

Jing-Zhe Jiang, Wen-Guang Yuan, Jiayu Shang, Ying-Hui Shi, Li-Ling Yang, Min Liu, Peng Zhu, Tao Jin, Yanni Sun, Li-Hong Yuan, Virus classification for viral genomic fragments using PhaGCN2, Briefings in Bioinformatics, 2022;, bbac505, https://doi.org/10.1093/bib/bbac505

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值