AIDD(AI Drug Discovery & Design):是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力。倾向于机器对数据库信息的自我学习,可以对数据进行提取和学习,一定程度上避免了化合物设计过程中的试错路径,同时还会带来很多全新的结构,为药物发现打破常规的结构壁垒。覆盖了机器学习和深度学习,能与新药研发相结合并实质性的应用到靶点预测、高通量筛选、药物设计、药物的ADMET性质预测等;且算力方面,由早期应用于药物发现领域的决策树、随机向量机等机器学习模型,进展到深度神经网络、卷积神经网络、循环神经网络等深度学习算法。具体到新药研发环节:如靶点识别,基于决策树来预测与疾病相关的基因,有研究者发现了多种EF在信号通路和胞外定位中的调控作用,并进一步基于靶点的结构和几何特征,选取一定量蛋白的数十个结合位点以及大量的非药物结合位点,构建随机森林分类器来预测药物靶点,并有研究者进一步采样提升了随机森林算法,成功的从非药物靶点中区分了药物靶点。再如,活性筛选方面,AIDD可以对候选化合物进行筛选,从而更快的筛选出作用于特定靶点且具有较高活性的化合物
- 基于配体结构的虚拟筛选——分类模型的构建与应用
1.1 数据处理与特征化(RDKit,Pandas)
1.1.1 数据标准化
1.1.2 数据特征化
1.2 模型构建(Sklearn)
1.2.1 支持向量机算法原理
1.2.2 随机森林算法原理
1.2.3 k最近邻算法原理
1.2.4 极限梯度提升算法原理
1.3 模型评估
1.3.1 模型的评估方法
(1)交叉验证