简介
目前,一个上市的药物平均需要花费20-30亿美元,并且需要10年左右的研发时间。大部分经费都花费在了昂贵且耗时的湿实验部分,初始Hits阳性率太低以及(临床前)阶段的高损耗率。使用基于结构的虚拟筛选,Hits质量随着筛选化合物的数量而提高。尽管存在大量的化合物数据库,但是缺乏有效的灵活的方式使用计算机集群进行大规模的SBDD的手段。本文介绍VirtualFlow,这是一个高度自动化的开源平台,可以有效的准备化合物库并进行超大规模的虚拟筛选。VirtualFlow能够使用各种强大对接程序。本文准备了目前已知的最大的免费使用的配体库,配体库包含了超过14亿个可商业购买的分子。VirtualFlow可以探索广阔的化学空间,并可以准确的识别与目标蛋白具有高亲和力的分子。
VirtualFlow的特征
VirtualFlow可以在任何资源管理器上使用,例如:SLURM(https://slurm.schedmd.com),Moab / TORQUE(http://www.adaptivecomputing.com),PBS(http:// www.pbspro.org),LSF(https://www.ibm.com/us-zh/marketplace/hpc-workload-management)和SGE(http://gridscheduler.sourceforge.net)。VirtualFlow还可以理想地配置用于云计算平台,例如亚马逊的Web服务(AWS),微软的Azure和Google的云平台(GCP)。VirtualFlow能够在流程中自主计算配体库中的所有分子,该功能可通过自动提交批处理系统作业来实现,可以在运行时监视和控制流程。VirtualFlow程序包由两个可无缝协作的应用程序组成:VFLP(用于配体准备的模块)和VFVS(用于虚拟筛选的模块)。配体准备和虚拟筛选的过程是分离的。
VirtualFlow在药物发现过程中的应用
图片来源 Nature
VFLP 模块
VFLP通过将配体数据库从SMILES格式转换为任何所需的目标格式(例如,基于AutoDock的对接程序所需的PDBQT格式)。VFLP使用ChemAxon的JChem软件包以及Open Babel来将处理配体分子,可以将配体分子进行脱盐处理,中和处理,生成互变异构体,计算特定pH状态下的配体质子化状态,计算其三维坐标并将分子转换成所需的格式。
市售化合物是化学领域中最令人感兴趣的空间,因为这些化合物很容易购买。目前可用的最大供应商库之一是Enamine的REAL库,其中包含约14亿个按需定制化合物。我们使用VFLP将REAL库中约14亿种化合物转换为PDBQT格式,并使该库可在VirtualFlow主页上免费使用,可通过图形界面进行访问。整个数据库具有六维属性,每个维对应于化合物的物理化学性质(分子量,分配系数,氢键供体,受体的数量,可旋转键的数量以及拓扑极性表面积)。
VFVS模块
使用VFVS进行虚拟筛选,用户需要指定一组对接方案。通过选择对接程序,受体结构和对接参数(包括受体上的预定义对接表面,受体上柔性残基)的严格性来定义对接方案对接例程。当前,VirtualFlow支持以下对接程序:AutoDock Vina,QuickVi