1、前言
方便自己,帮助他人。
该文章发表在Nature Communication中;该软件输入酶以及其底物即可预测动力学参数。
2、安装方法(操作系统为Linux,需要英伟达独显)
首先,将该软件下载到本地
git clone https://github.com/zchwang/CataPro.git
如果失败进入该github链接,下载ZIP文件,并且解压
创建并且激活环境
conda create -n catapro python=3.10
conda activate catapro
安装PyTorch(需匹配CUDA版本)
conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=11.8 -c pytorch -c nvidia
安装其他基础包
conda install -c conda-forge rdkit -y
pip install transformers pandas "numpy<2" sentencepiece
最近需要进入Catapro的文件夹中,找到models文件夹,将这两个文件
prot_t5_xl_uniref50 and molt5-base-smiles2caption.下载下来,移动到models文件夹里即可。
温馨提示:有些文件是不需要下载的如prot_t5_xl_uniref50中,只要下载下面图中画勾的就行。pytorch_model_600k.bin,pytorch_model_723k.bin不需要下载,这是过程文件。
3、使用方法
准备这样的csv文件
直接进入Catapro的inference文件夹中运行下方的
python predict.py \
-inp_fpath samples/sample_inp.csv \
-model_dpath models \
-batch_size 64 \
-device cuda:0 \
-out_fpath catapro_prediction.csv
即可成功执行,输出的为catapro_prediction.csv
这个结果是不同酶的动力学参数。