科研背景
生物医学是综合医学、生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题。机器学习技术能利用复杂的算法在大规模、异质性数据集中进行运行,在生物医学方面、人类基因组项目、癌症全基因组项目、等项目上都表现出了巨大的潜力,收集并分析与医学疗法和患者预后相关的大量数据集或能将医学转化称为一种数据驱动、以结果为导向的学科,其对于疾病的检测、诊断都有着非常深远的影响。
CADD(Computer Aided Drug Design)的推广应用,经过数十年的积累,已成为当今药物研发不可或缺的一部分,且国内外产出了部分实质性的成果。国外一些大型制药公司如默克、罗氏、诺华等,已经有一些领域通过CADD技术获得了更优的产品,甚至已成功上市,如血管紧张素转化酶抑制剂卡托普利、HIV-1蛋白酶抑制剂沙奎那韦、神经氨酸酶抑制剂扎那米韦等,均用到了一定的CADD来辅助结构优化设计。
AIDD(AIDrug Discovery & Design)范围来说覆盖了机器学习和深度学习,能与新药研发相结合并实质性的应用到靶点预测、高通量筛选、药物设计、药物的ADMET性质预测,等;且算力方面,由早期应用于药物发现领域的决策树、随机向量机等机器学习模型,进展到深度神经网络、卷积神经网络、循环神经网络等深度学习算法。
基因组学(genomics)是对生物体所有基因进行集体表征、定量研究及不同基因组比较研究的一门交叉生物学学科,基因组学的目的是对一个生物体所有基因进行集体表征和量化,并研究它们之间的相互关系及对生物体的影响 。机器学习已经被广泛应用于基因组学研究中,利用已知的训练集对数据的类型和应答结果进行预测,深度学习,可以进行预测和降维分析。深度学习模型的能力更强且更灵活,在适当的训练数据下,深度学习可以在较少人工参与的情况下自动学习特征和规律。调控基因组学,变异检测,致病性评分成功应用。深度学习可以提高基因组数据的可解释性,并将基因组数据转化为可操作的临床信息。改善疾病诊断方案,了解应该使用哪些药物和给谁服用药物,最大限度的减少副作用,最大限度的提高疗效,所有这些都要求从基因组原始数据开始进行分析。这将是一项非常耗时的过程,因为涉及到的变量太多了,而深度学习恰恰能帮助缩短这一过程。
单细胞空间转录组(Single-Cell Spatial Transcriptomics) 是一种新兴的基因组学技术,它可以提供细胞组织中细胞的空间分布和基因表达的精确图像。从而更好地理解细胞组织中细胞的功能和表型。它可以提供有关细胞组织中细胞的空间分布和基因表达的更多信息,从而有助于更好地理解细胞组织中细胞的功能和表型。因此,单细胞空间转录组技术可以为研究细胞组织中细胞的功能和表型提供重要的信息。
科研目标
课程一:CADD计算机辅助药物设计实践应用专题
课程二:AIDD人工智能药物发现实践应用专题
课程三:深度学习在基因组学实践应用专题
课程四:机器学习单细胞分析实践应用专题
课程五:单细胞空间转录组实践应用专题
课程六:机器学习在蛋白质组学实践应用专题
课程内容
课程一、CADD计算机辅助药物设计
第一节课程 背景与理论知识以及工具准备 |
生物分子相互作用基础 1.1生物分子相互作用研究方法 1.2蛋白-小分子,蛋白-蛋白相互作用原理 1.2分子对接研究生物分子相互作用 1.3蛋白蛋白对接研究分子相互作用 2.PDB及PDBsum数据库的介绍和使用 2.1数据库简介(功能,可获取资源,重要性) 2.2靶点蛋白的结构查询与选取 2.3靶点蛋白的结构序列下载 2.4靶点蛋白背景分析 2.5批量下载蛋白晶体结构 3.Pymol软件的介绍与使用 3.1软件安装及基本知识介绍 3.2蛋白小分子相互作用图解 3.3 蛋白蛋白相互作用图解 3.4蛋白-配体小分子表面图、静电势表示 3.5蛋白-配体结构叠加与比对 3.6绘制相互作用力 3.7 pymol动画制作 3.8 实例讲解与练习 4.notepad++的介绍和使用 |
第二节课 小分子化合物库及蛋白-配体对接讲解 |
1.ChemDraw软件介绍 1.1小分子结构构建 1.2 小分子理化性质计算 1.3实例讲解 2.小分子数据库 2.1Zinc,ChEMBL,DrugBank等数据库介绍及使用 2.2其它常用数据库介绍及使用 3.分子对接基础 3.1分子对接的原理及软件介绍 3.2分子对接软件(Autodock/Autodock vina)使用 3.3半柔性对接 3.3.1小分子配体优化准备 3.3.2 蛋白受体优化及坐标文件准备 3.3.3 半柔性对接计算 3.2对接结果评价 3.2.1晶体结构构象对比 3.2.2能量角度评价对接结果 3.2.3聚类分析评价对接结果 3.2.4最优结果选择 4 柔性对接 4.1 半柔性对接与柔性对接的比较 实例讲解与练习 |
第三节课 虚拟筛选 |
1.openbabel的介绍和使用 1.1openbabel软件介绍 1.2小分子结构类型 1.3小分子结构类型转换 2.分子对接用于虚拟筛选 2.1虚拟筛选定义、流程 2.2靶蛋白选取,化合物库获取 2.3虚拟筛选 2.4结果分析 虚拟筛选的流程及实战演示 3.药物ADME预测 3.1ADME概念介绍 3.2预测相关网站及软件介绍 3.3预测结果的分析 |
第四节 拓展对接的使用方法 |
1.蛋白-蛋白大分子对接 1.1蛋白-蛋白对接的应用场景 1.2相关程序的介绍 1.3受体和配体蛋白前期优化准备 1.4蛋白蛋白相互作用对接位点设定 1.5蛋白蛋白对接结果分析与解读 实例讲解与练习 2.蛋白-多肽对接 2.1 蛋白-多肽相互作用简介 2.2 蛋白-多肽分子预处理 2.3 蛋白-多肽分子对接 2.4 对接结果展示与分析 实例讲解与练习 3.含金属离子的蛋白靶点与小分子对接 3.1 金属酶蛋白-配体的相互作用介绍 3.2 相关蛋白及配体分子的收集与预处理 3.3 金属离子的处理与准备 3.4 金属辅酶蛋白-配体的对接 3.5 对接结果展示与分析 实例讲解与练习 4.核酸-小分子对接 4.1 核酸-小分子的应用场景 4.2 核酸-小分子相互作用简介 4.3 核酸-小分子的预处理 4.4 核酸-小分子对接 4.5 相关结果的展示与分析 实例讲解与练习 5.共价对接 5.1共价对接的原理及应用场景 5.2 蛋白和共价结合配体的预处理 5.3 药物分子与靶蛋白的共价对接 5.4 相关结果的展示与分析 实例讲解与练习 |
第五节 药效团模型及基于碎片的药物设计 |
药效团模型的构建与使用 1.1药效团模型介绍 1.2药效团模型的构建 1.3药效团模型用于虚拟筛选 实例讲解与练习 2. 基于碎片药物设计 2.1基于碎片的药物设计与发现 2.2 基于碎片化合物库构建 2.2.1 骨架替换 2.2.2 碎片连接 2.2.3 碎片生长 2.3 基于药效团的化合物库生成 2.4 基于蛋白结合口袋的化合物库生成 2.5 基于分子描述符的化合物库生成 2.6 基于BREED规则的化合物库构建(生成小配体碎片库) 2.7 基于碎片的化合物库筛选 实例讲解与练习 3.QSAR模型介绍及构建 3.1 QSAR模型介绍 3.2 QSAR模型创建 3.3 QSAR模型分析 3.4 QSAR模型指导药物设计 实例讲解与练习 |
第六节 分子动力学模拟 |
1.Linux入门 1.1 Linux常用命令 1.2 Linux环境变量 1.3 Linux上的操作体验(分子对接) 2. 分子动力学模拟介绍 2.1分子动力学简介 2.1.1 分子力学的基本假设 2.2.2 分子力学的主要形式 2.2分子力场的介绍与应用 3 |