原创 Mengying Sun 图科学实验室Graph Science Lab 2022-06-18 00:00 发表于台湾
药物开发是一个昂贵且耗时的过程,需要对数千种化合物进行测试和实验,以找出安全有效的药物。现代药物开发旨在通过利用机器学习技术加快中间步骤并降低成本,通常是在药物发现和临床前研究阶段。更好地识别有前途的候选人可以显着减少后期流程的负担,例如临床试验,节省大量资源和时间。
在本论文中,我们从鲁棒性、知识转移、分子生成和优化等方面探索并提出了新的药物发现机器学习算法。首先,来自高通量实验(例如,生物分析和化学筛选)的标签通常包含由于技术和生物变化而不可避免的噪声。我们提出了一种方法(RCL),该方法利用深度神经网络之间的分歧和一致来减轻噪声标签带来的负面影响并更好地预测药物反应。其次,图神经网络 (GNN) 在建模图结构数据(例如分子)方面变得很流行。图对比学习通过最大化配对图增强之间的互信息,已被证明是预训练 GNN 的有效策略。然而,现有的图对比学习方法在用于分子任务时具有内在的局限性。因此,我们提出了一种方法(MoCL),该方法利用本地和全局级别的领域知识来辅助表示学习。本地级别的领域知识指导增强过程,以便在不改变图形语义的情况下引入变化。全局级知识对整个数据集中图之间的相似性信息进行编码,并有助于学习具有更丰富语义的表示。最后但同样重要的是,我们提出了一种基于搜索的方法 (MolSearch),用于多目标分子的生成和优化。我们表明,在适当的设计和足够的信息下,基于搜索的方法可以实现与深度学习方法相当甚至更好的性能,同时具有计算效率。具体来说,所提出的方法从现有分子开始,并使用两阶段搜索策略,根据来自大型化合物库的转换规则,逐步将它们修改为新分子。我们通过大量实验证明了所有提出的方法。
综上所述,RCL 能够准确预测药物诱导的基因表达变化,这为基于特定疾病逆转特征的虚拟药物筛选奠定了基础。在数据不足的情况下,任何利用图神经网络进行分子任务的方法都可以利用 MoCL 来提高预测精度。MolSearch 能够生成具有所需特性的分子,并优化目标特性以获得更好的候选药物。
论文题目:
作者:Mengying Sun
类型:2022年博士论文
学校:Michigan State University(美国密西根州立大学)
下载链接:
链接: https://pan.baidu.com/s/1_7Hkzu_h5Atfz38vAhJYFA?pwd=ghsh
提取码: ghsh
硕博论文汇总:
链接: https://pan.baidu.com/s/1PW00x6Xevz4WCHoaV2aS-g
密码: 9g0k