药品的临床疗效与安全性由在人类蛋白质组内的分子靶标决定。本文中,湖南大学信息科学与工程学院的李肯立/曾湘祥教授课题组提出了一种无监督的预训练深度学习框架,对 1000 万个未标记的类药性、生物活性分子进行预训练,以预测候选化合物的药物靶标和分子性质。
论文标题:
Accurate prediction of molecular properties and drug targets using a self-supervised image representation learning framework
论文链接:
https://www.nature.com/articles/s42256-022-00557-6
收录期刊:
Nature Machine Intelligence
背景介绍
药物的临床疗效和安全性取决于药物分子的性质和药物作用的靶点。然而,通过湿实验和临床实验的方式评估药物性质和药物靶点是代价巨大的,平均一款新药的研发需要花费 10 年以上时间,10 亿美元成本。通过人工智能技术预测药物性质和药物靶点,可以加速药物研发进程,大幅减少药物研发成本。
在计算机视觉中无监督的最新进展下,本文开发了一个具有化学意识的无监督分子图像预训练框架—— ImageMol,用于从大规模分子图像中学习分子结构。ImageMol 将图像处理框架与综合分子化学知识相结合,以可视化计算的方式提取精细像素级分子特征,在各种药物发现任务中演示了 ImageMol 的高准确性,为计算药物发现提供了一个强大的预训练深度学习框架。
本文创新和贡献:
1. 以往分子性质及药物靶标预测的研究大多围绕序列表示和图(graph)表示展开,它们在提取分子表征时存在一定的局限性。本文提出首个基于分子图像的无监督深度学习框架,为性质预测与靶标预测的分子图像推理提供了基础性、关键性的支撑,证明了分子图像在该领域具有巨大的潜力,