2021SC@SDUSC
数据集
然后是对基准数据集的介绍,KIBA和DAVIS
使用CI和r2m度量标准来衡量所提出的模型和基准模型的性能。
对于Davis和KIBA数据集中蛋白质和药物的输入,我们采用了DeepDTA方法,通过字典将药物和蛋白质序列的smile数字化到一个固定的最大长度。
deepDTA
deepDTA论文笔记:csdn:https://blog.csdn.net/qq_40311018/article/details/109672553
实验设置
作者在基准数据集上评估了MATT_DTI算法的性能。与DeepDTA研究一样,我们首先将训练数据裁剪为训练集和验证集,找出模型的最优设置,如滤波器个数、滤波器长度、隐藏大小、dropout rate和epoch个数。本节给出的最终结果是经过5次训练的测试集的平均结果。表2给出了基于数据集的实验参数设置。所有的模型都接受过训练
训练机器配置:1 NVIDIA 2080Ti GPU。
论文配置:
两个评估指数的计算方法
实验1:基于相对位置的自注意力药物表示学习
Experiment 1: relation-aware self-attention-based
representation learning for drug compounds
self-aware的结果就比前面强了,起码是不低于前面的已有方法,而relation-aware更是进一步提高这个效果
实验2:基于多头注意力的相互学习
Experiment 2: interaction learning with multi-head
attention
控制变量法可以对比看出两个注意力机制模块对于模型效果的贡献
实验三:最大相对位置的影响
Experiment 3: effects of max relative position length
基于MATT_DTI:
KIBA:
DAVIS:
在效果最好的最大相对位置基础上对matt-dti与其他现有方法进行一个整体的效果比较
新冠病毒肆虐,这是作者利用该方法预测出的3个新冠genome sequence与FDA批准药物的亲和力top榜,为相关研究者提供研究材料。
结论:
在这项工作中,作者提出了一个基于多个注意块的模型增强原子之间的相对位置信息编码药物和模型之间的药物表示和目标表示。
在两个基准数据集上的实验结果证明了本文方法的有效性。
广泛的分析表明,编码相对位置信息有利于药物表示,对药靶结合的模拟可以进一步改善亲和力预测性能,并且对于基准数据集KIBA和DAVIS来说,最大相对位置长度为3-5。
此外,我们还利用训练后的模型预测了sars - cov -2相关基因组序列和3137种fda批准药物的结合亲和力评分,为covid -19相关科学家提供一些参考。