DeepautoQSAR、ChemProp、DeepPurpose ADMET性质预测测评

本文始发与公众号 AI智药,如需转载联系作者

综述

随着更强大的硬件和方法的出现,机器学习(ML)方法新药研发中的应用出现了显着增长,特别ADMET性质预测方面ML方法已经成为重要的手段。本文介绍了薛定谔自动化ML模型构建引擎DeepAutoQSAR通过构建和测试大规模数据预测化合物的ADMET性质。同时,还将DeepAutoQSAR的性能与两个开源项目ChemProp和DeepPurpose的性能进行了比较。DeepAutoQSAR在22个案例中的20个是表现最好的方法之一,在其中9个中明显优于其他方法。对于其他11种情况,至少有一种其他测试方法的性能相似。DeepAutoQSAR在准确性、对化学数据转移的稳健性和标签效率方面的持续发展和进一步改进,将使药物发现的速度更快、成本效益更高,最终导致新疗法的引入。

数据集展示

1、ADMET数据集的集合来自TDC数据存储库,表内提供了数据集缩写代码、ADMET分类和预测任务的高级描述。

2、回归数据集,数据集大小、精度测量方法、训练/测试拆分选择方法

 

3、 分类数据集,数据集大小、精度测量方法、训练/测试拆分选择方法

测试方法

 DeepAutoQSAR 的程序工作流程始于数据预处理和交叉验证拆分,以及模型集成选择的设置过程。然后训练独立的 ML 模型以优化保留分子的性能,从而产生在推理时具有强大性能的最终模型集合。

结果展示 

1、吸收数据集的性能结果

2、分布数据集的性能结果 

 3、代谢数据集的性能结果

4、排泄数据集的性能结果

 5、毒性数据集的性能结果 

 

结果统计

1、DeepAutoQSAR和ChemProp在具有相关不确定性的所有端点上的相对性能。左上角显示了由MAE衡量的任务的性能,越低越好。右上方和下方的行图显示了由Spearman相关性、AUPRC和AUROC测量的性能,其中越高越好。(颜色表示数据集的ADME/Tox名称)

 2、DeepAutoQSAR和ChemProp在具有相关不确定性的所有端点上的相对性能。左上角显示了由MAE衡量的任务的性能,越低越好。右上方和下方的行图显示了由Spearman相关性、AUPRC和AUROC测量的性能,其中越高越好。(颜色表示数据集的ADME/Tox名称)

 

 

3、DeepAutoQSAR DeepPurposeKit2D+MLP之间每个数据集的性能比较

 

4、DeepAutoQSAR和DeepPurposeCNN之间每个数据集的性能比较

 

5、DeepAutoQSAR DeepPurposeMorgan+MLP之间每个数据集的性能比较

 

 

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
03-03 1096
问题2: 首先,根据问题1选择不超过20个分子描述符变量,可以使用特征选择方法,比如LASSO、随机森林等方法,选择对ERα生物活性影响最大的分子描述符。然后,使用这些分子描述符构建回归模型,比如支持向量回归(SVR)、随机森林回归等方法。在建模过程中,需要对数据进行预处理,比如归一化、标准化等。为了避免过拟合,可以使用交叉验证方法进行模型评估和调参。 对于测试数据,先预处理数据,然后使用构建的预测模型对其进行预测,得到IC50值和对应的pIC50值,最后将结果填入“ERα_activity.xlsx”的test表中的IC50_nM列及对应的pIC50列。 问题3: 选择Caco-2和hERG作为分类指标。首先,根据分子描述符数据集“Molecular_Descriptor.xlsx”,提取Caco-2、hERG对应的分子描述符特征。然后,使用分类模型,比如支持向量机(SVM)、决策树等方法,对数据进行建模。在建模过程中,同样需要进行数据预处理和模型评估、调参。 对于测试数据,先预处理数据,然后使用构建的分类模型对其进行预测,得到相应的分类结果,最后将结果填入“ADMET.xlsx”的test表中对应的Caco-2、hERG列。 问题4: 这是一个比较复杂的问题,需要综合考虑ERα生物活性和ADMET性质的多个因素。一般来说,化合物的分子大小、极性、电荷分布、亲水性等因素都会对其生物活性和ADMET性质产生影响。同时,不同的化合物可能对不同的指标有不同的影响。 因此,在寻找化合物的优良分子描述符时,需要进行综合分析和筛选,可以使用特征选择方法或者机器学习方法进行探索。同时,需要进行实验验证和结合现有文献进行分析,以得到更加可靠的结论。 总之,化合物的优良分子描述符是一个复杂的问题,需要综合考虑多个因素,同时也需要不断探索和验证。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值