药物设计
文章平均质量分 85
AIDrug 测测深不可测
这个作者很懒,什么都没留下…
展开
-
相互作用的检索增强 3D 分子生成扩散模型 - IRDiff 评测
IRDiff 是一个全新的基于蛋白质-配体相互作用的检索增强 3D 分子扩散模型,可以生成目标感知的分子。IRDiff 利用一组设计好的参考配体分子来引导扩散模型生成满足目标特性的分子。本文对 IRDiff 进行了评测,修正了GitHub上的代码错误,使用内置案例和自有案例对 IRDidd 进行分子生成测试,并检查生成结果。原创 2024-10-01 09:51:47 · 563 阅读 · 0 评论 -
分子属性梯度引导的3D分子生成扩散模型 TAGMOL - 评测
TAGMoL 是一个基于分子属性条件引导扩散的3D分子生成模型,适合在给定靶标蛋白质的情况下,可以生成一系列满足目标特性(分子属性,binding affinity)的候选分子。。原创 2024-08-25 13:21:20 · 1072 阅读 · 0 评论 -
评估生成分子/对接分子的物理合理性工具 PoseBusters 评测
PoseBusters 是一个基于 RDKit 的 Python 包,通过一系列标准检查配体对接姿势的化学有效性和物理合理性。来源于牛津大学统计学系 Martin Buttenschoen、Garrett M. Morris 和 Charlotte M. Deane 合作的文章:《PoseBusters: AI-based docking methods fail to generate physically valid poses or generalise to novel sequences》。。原创 2024-08-04 22:03:57 · 1101 阅读 · 0 评论 -
SQUID - 形状条件下的基于分子片段的3D分子生成等变模型 评测
基于形状的虚拟筛选在基于配体的药物设计中至关重要,主要目的是识别与已知配体具有相似 3D 形状的分子。传统方法(例如:openeye 的 ROCS)依赖于枚举的化学库,这限制了新化学空间的探索。为此,作者开发了SQUID模型。SQUID 是在 形状条件下 3D 分子生成模型,可以用于在形状条件下的化学空间探索任务。原创 2024-07-21 15:05:42 · 1213 阅读 · 0 评论 -
药物设计中的SE3等变图神经网络层- EGNN 代码解析
此部分内容介绍了常用在药物设计深度学习中的SE3等变网络层 EGNN。主要对EGNN的代码逻辑、模块进行解析,并介绍其中的SE3等变在模型中的原理。原创 2024-06-04 23:43:49 · 1469 阅读 · 0 评论 -
3D分子生成的定制扩散框架 MolDiff - 评测
作者提出了对原子和分子键同时进行概率采样的扩散模型MolDiff。MolDiff基于SE3等变神经网络,同时进行原子和化学键的消息传递。原创 2024-05-12 16:47:20 · 1603 阅读 · 4 评论 -
PMDM-针对特定口袋的分子扩散生成模型 评测
PMDM 模型是腾讯AI Lab近期发表在Nature Communication上的分子生成文章。PMDM通过二元等变扩散网络,利用全局和局部分子动力学信息,将目标口袋的 3D 结构感知为条件信息,并结合分子和蛋白质之间的相互作用,学习分子概率。PMDM可以生成结构有效且构效合理的,契合口袋的3D分子。本文以自己的3WZE体系为例子,使用作者开源的代码和checkpoint,对PMDM莫进行测评原创 2024-04-13 21:04:14 · 1804 阅读 · 8 评论 -
口袋条件下的Lead优化几何深度模型-Delete 评测
Delete 模型是浙江大学侯廷军老师发表2023年8月4日在arXiv上的文章,文章名:Delete: Deep Lead Optimization Enveloped in Protein Pocket。Delete 模型基于mask策略,按照作者的描述,首先是随机掩码预训练模型,然后是应用于骨架跃迁、linker设计,片段延伸、侧链修饰的四个微调模型。通过,vina energy等分析,发现 Delete 模型生成的分子可能具有更好的活性。原创 2024-03-24 20:37:56 · 1422 阅读 · 2 评论 -
应用于蛋白-小分子动态对接的等变几何扩散模型-DynamicBind 评测
DynamicBind是上海交通大学郑双佳研究员和星药科技Lu wei等人于2024年2月5日发表在nature communication上的工作,题目为:DynamicBind: predicting ligand-specific protein-ligand complex structure with a deep equivariant generative model。本文对Dynamicbind进行了评测,分析了ABL1的底物位点和变构位点的对接结果,以及隐蔽口袋的案例TEM1。原创 2024-02-20 21:28:14 · 1794 阅读 · 2 评论 -
基于片段的3D分子生成扩散模型 - AutoFragDiff 评测
本文是AutoFragDiff模型的测评文章。传统的,基于口袋的3D分子生成网络的常用方法是自回归模式,模型放置原子和原子键是迭代的,逐个进行。但是这种方式会导致误差的积累,同时生成速度较慢,生成苯环分子也需要6个步骤。而使用基于分子片段的自回归方法可以避免这个问题。作者使用使用几何矢量感知器和自回归扩散模型 Autoregressive Diffusion Models (ARDMs),以自回归的模式,分子骨架和蛋白质口袋为条件下,逐个预测新分子片段的原子类型和空间坐标。原创 2024-02-10 08:57:05 · 1651 阅读 · 0 评论 -
知识引导的分子生成扩散模型 - KGDiff 评测
KGDiff模型是一个基于口袋的知识引导的3D分子生成的扩散模型。基于口袋的分子生成模型之前有介绍过targetdiff,FLAG等。其中,KGDiff与TargetDiff类似,KGDiff模型也是一个扩散模型,应针对的是口袋条件下的3D分子生成。KGDiff的创新点在于:KGDiff模型利用领域知识,例如,vina score,指引分子生成过程中的去噪过程,可生成高结合力的分子。此外,KGDiff还是一个原子层级可解释性的模型,在生成分子时,同时给出生成分子预测score,原子层面的score。原创 2024-01-11 21:06:13 · 1850 阅读 · 0 评论 -
分子生成工具 - ResGen 评测
ResGen是基于蛋白口袋为条件的三维分子生成的E3等变自回归模型。ResGen建立在并行多尺度建模的原理之上,可以捕获更高层次的口袋分子交互并实现更高的计算效率(比之前最好的模型快大约八倍)。全局自回归和原子自回归。全局自回归在口袋里生成原子,原子自回归是依次产生新添加的原子的坐标和拓扑。与其他分子生成模型相同,ResGen模型同样遵循E3等变特性。模型结构如下图:上图a 在分子生成的过程中,逐步地确认生长点,添加原子(全局自回归),确认原子的位置,然后添加边(原子自回归)。原创 2023-12-22 22:49:29 · 1910 阅读 · 15 评论 -
Schrodinger 分子形状筛选工具Shape Screen 使用方法
schrodinger的shape screen方法是一种基于ligand的筛选方法。需要提供一个参考分子,和需要筛选的分子库。shape screen可以根据原子类型、药效团对分子的形状相似度进行打分。原创 2023-11-19 11:38:14 · 362 阅读 · 0 评论 -
基于片段的分子生成网络 (FLAG)使用方法及案例测评
作者提出了一个基于片段的分子生成网络,FLAG (Fragment based LigAnd Generation framework)。在FLAG中,从数据集中提取共同的分子片段,构建了motif的词汇库。在每个生成步骤中,首先采用 3D 图神经网络对中间上下文信息(口袋)进行编码。然后,FLAG模型选择中心motif,预测下一个motif类型,并连接motif。原创 2023-10-12 23:09:32 · 769 阅读 · 12 评论 -
基于SE3等变网络与Diffusion模型的分子生成工具 TargetDiff 评测
TargetDiff是来源于ICLR2023文章:3D Equivariant Diffusion for Target-Aware Molecule Generation and Affinity Prediction。该文章基于 SE(3)-equivariant network,开发了非自回归的,具有旋转和平移不变性的,口袋为条件的分子扩散生成模型TargetDiff。原创 2023-06-09 08:03:05 · 1546 阅读 · 10 评论 -
Diffusion Models 简单代码示例
扩散模型的目标是通过数据在潜在空间(latent space)的扩散过程,学习数据的潜在向量结构(latent structure),通俗点说,扩散模型学习利用数据逐步变成噪声的过程,学习反向的去噪声过程。基于 GAN 生成模型,基于 VAE 的生成模型,以及基于 flow 的生成模型它们都可以生成较高质量的样本,但每种方法都有其局限性。扩散模型的灵感来自于非平衡热力学。他们定义了一个扩散步骤的马尔可夫链,慢慢地向数据添加随机噪声,然后学习反向扩散过程,从噪声中构建所需的数据样本。原创 2023-04-08 23:20:53 · 4302 阅读 · 10 评论 -
分子骨架跃迁工具DiffLinker评测
DiffLinker是一个用于分子骨架跃迁的E3等变3D条件扩散模型。。与之前介绍的Delinker, 3DLinker等不同,DiffLinker可以连接任意的分子片段,而3Dlinker等仅仅可以链接一对(2个)分子片段。同时,DiffLinker也不需要指定链接处和需要添加的原子数量,这些都可以自动生成。此外,可以使用口袋作为条件,进行骨架跃迁任务,并且提供了详细的使用文档。原创 2023-02-05 15:44:42 · 1566 阅读 · 4 评论 -
分子骨架跃迁工具3DLinker 评测
与之前介绍的骨架跃迁工具不同,3DLinker是变分自动编码器模型,可以在分子linker 设计同时生成分子和分子的坐标。文章引入了空间归纳偏差:equivariance E(3) transformations (等方差E3变换)。3DLinker以两个分子片段作为输入,输出中间的Linker部分,在输出分子结构的同时还输出linker的坐标。原创 2022-10-24 21:48:22 · 2456 阅读 · 1 评论 -
分子骨架跃迁工具-DeLinker介绍
DeLinker是一个既可以实现分子骨架跃迁又可以实现分子连接的AI方法。这里对该方法,进行实应用测检验,顺便做了DeLinker在分子骨架跃迁中应用部分的代码分析。原创 2022-07-24 08:58:39 · 1921 阅读 · 0 评论 -
小分子结合位点/成药位点识别工具-PointSite
现在有很多AI开发的各种方法和工具,可以替代传统的CADD工具。这里介绍的PointSite这个工具可以从原子级别识小分子的结合位点,参考文章来源于Zhen Li的工作,原文链接:PointSite: a point cloud segmentation tool for identification of protein ligand binding atoms (biorxiv.org) PointSite将原始的3D蛋白质结构转译成点云(point clouds), 然后使用基于U原创 2022-07-07 00:21:13 · 1474 阅读 · 0 评论 -
图神经网络预训练 (5) - 总结
到目前为止,Conetext prediction 和 Attribute Prediction 两种节点和边层面的预训练方法,及其之后的图层面的分子性质监督学习预测,都已经介绍完毕。基本上,Strategies for Pre-training Graph Neural Networks 简介已经结束,并且提供了可以直接运行的代码及其环境。代码见之前文章的链接。现在来总结一下,其中包含的有用的内容:1. 分子由SMILES生成pyg图;2. 分子pyg图组成批次的datal...原创 2022-05-28 18:26:21 · 621 阅读 · 4 评论 -
图神经网络预训练 (4) - 节点属性预测 Attribute Prediction + 监督学习 代码
继续剖析Strategies for Pre-training Graph Neural Networks,介绍另一种节点层面的预训练方法,节点属性预测的预训练方法(Attribute Prediction)及其随后的监督学习用于分子性质预测部分。 可运行版本的代码下载,请见文末。原创 2022-05-28 17:13:56 · 4236 阅读 · 6 评论 -
图神经网络预训练 (3) - Context Prediction + 监督学习 代码
前两篇内容概述了Weihua Hu*, Bowen Liu*图神经网络预训练的方法,以及context prediction进行预训练的实施代码。context prediction 学习的图内的原子/边信息的表征,并没有包括图层面的信息。这一部分的监督学习,是图层次的监督学习,目的是把图层面的信息增加到图的表征向量G(h)中。经过图层次的监督学习,得到的模型就可以直接用于下游的任务。文章方法:在节点层面预训练的模型后加上一个简单的线性模型,用于图层面的监督训练网络结构如下图:..原创 2022-05-26 12:44:50 · 2321 阅读 · 3 评论 -
图神经网络预训练 (2) - 子结构预测 Context Prediction 代码
如上篇文章所提及,Strategies for Pre-training Graph Neural Networks一文的作者提出了节点层面进行预训练的两种方法,分别是:Context 和 Attribute Prediction。这两种预训练方法可以让模型学会节点层面嵌入。将预训练得到的模型用于下游图层面的任务时,可以很好的保留节点层面的信息,活得更好的泛化能力。接下来,这一部分就来具体介绍子结构预测 Context Prediction,并提供一个可以直接运行的代码版本。一、 Conte..原创 2022-05-23 23:51:29 · 2049 阅读 · 5 评论 -
图神经网络预训练(1) - Strategies for Pre-training Graph Neural Networks 简介
我们这次要复制的对象是一篇非常经典的关于图神经网络预训练策略的文章,是斯坦福大学Weihua Hu 课题组的工作,发表于2019年。参考文献Weihua Hu*, Bowen Liu*, Joseph Gomes, Marinka Zitnik, Percy Liang, Vijay Pande, Jure Leskovec. Strategies for Pre-training Graph Neural Networks. ICLR 2020他们开发了一种自监督的预训练方法,单个节点以及原创 2022-05-22 13:31:26 · 1251 阅读 · 0 评论 -
Auto-sklearn 安装及用于分子性质预测
简介Auto-sklearn 是一个自动化机器学习工具包,是 scikit-learn 直接替代品,是建立在sklearn进一步封装的基础上。Auto-sklearn不需要用户进行超参数的调节和模型的选择,而是自动进行。这里使用auto-sklearn进行分子的性质预测原创 2022-04-17 18:15:25 · 2539 阅读 · 0 评论 -
机器学习模型的超参数优化用于分子性质预测
机器学习模型超参数优化:网格搜索+交叉验证原创 2022-04-13 00:43:58 · 2395 阅读 · 0 评论 -
Gromacs 2021.5安装教程
GROMACS安装教程原创 2022-03-14 13:49:41 · 6955 阅读 · 0 评论 -
利用 AWS pcluster + Vina 进行百万级分子库虚拟筛选
利用AWS 的pcluster工具 + Vina 进行百万级的分子虚拟筛选原创 2021-12-21 00:36:51 · 2523 阅读 · 0 评论 -
使用Autodock Vina进行分子对接
AutoDock Vina 是一个用于进行分子对接的开源程序,由Molecular Graphics Lab的Oleg Trott博士开发。根据Oleg Trott等人测试结果,与 AutoDock 4 相比,AutoDock Vina 显着提高了结合模式预测的准确度。此外,Vina 可以利用系统上的多个CPU 内核来显着缩短其运行时间。一、安装1. 安装Auto Docking Vina从http://vina.scripps.edu/download.html Auto Docking Vina下原创 2021-12-16 00:03:36 · 10884 阅读 · 10 评论 -
一起学 RDKit Cookbook(2)
这部分内容来自于RDKIT的简单教程:https://www.rdkit.org/docs/Cookbook.htmlRDKIT算是化学生物的神器了,以前每一次都是即时查接口,现在按照这个简易教程走一遍,增加感觉。 最好的办法就是全程过一遍。当然啦,在这些过程中,也有我自己对RDKit的一些理解吧。如果有不对的地方,请多多指正!##三、标记分子手型...原创 2021-05-12 21:21:15 · 704 阅读 · 0 评论 -
一起学 RDKit Cookbook (1)
这部分内容来自于RDKIT的简单教程:https://www.rdkit.org/docs/Cookbook.html RDKIT算是化学生物的神器了,以前每一次都是即时查接口,现在按照这个简易教程走一遍,增加感觉。 最好的办法就是全程过一遍。当然啦,在这些过程中,也有我自己对RDKit的一些理解吧。如果有不对的地方,请多多指正!一、画分子Chem.MolFromSmiles()输入的字符串是SMILES(用于表示分子的一种方法),得到的是mol对象;mol对象是rdkit的特殊的对象,专门用于保存原创 2021-05-07 00:39:58 · 2613 阅读 · 0 评论 -
将分子SMILES生成DGLGraph
其实将分子的SMILES转化为图是很简单的,也是很便捷的,主要有以下几步:一、导入相关的包import numpy as npimport torchimport dglfrom dgl import DGLGraphfrom rdkit import Chemfrom rdkit.Chem import rdMolDescriptors as rdDesc二、将SMILES转化为RDKIT的mol对象,同时生成一个空的dgl图molecule_smiles='[C@@H](Cl)(F)原创 2021-04-22 23:20:32 · 6569 阅读 · 11 评论 -
Paper再现:MD+AI自动编码机探测蛋白变构(四):DIO的生成和聚类
四、 DIO的生成和聚类这一部分比较简单,就是一个sklearn的聚类分析而已,所以没必要说什么,直接上代码。这里一个主要问题是,sklearn里面的聚类方法,是单核运行的,于是运行的速度很慢,这个蛋白只有500左右的残基,已经需要3个小时。所以,应该找其他方法代替。4.1导入相关模块#加载模块import pandas as pdimport numpy as npimport timeimport torch import torch.nn as nnimport torch.nn.原创 2021-04-07 00:03:08 · 390 阅读 · 2 评论 -
Paper再现:MD+AI自动编码机探测蛋白变构(三):训练自编码模型
三、训练自编码模型文章中是用的自动编码机是很简答的模型,如下图。由于这一部分是比较简单的,有一点神经网络基础的都很快可以完成,所以就写的简单一些哈。我们也来模仿这个简单的自动编码机模型。使用pytorch来建模。3.1 导入相关模块#导入相关模块import timeimport torchimport torch.nn as nnimport torch.nn.functional as Ffrom torch import optimfrom torch.optim import原创 2021-02-08 00:12:17 · 381 阅读 · 1 评论 -
Paper再现:MD+AI自动编码机探测蛋白变构(二):MD数据处理及特征化
2.1 数据的预处理先来讲讲项目的结构吧。整个项目的文件路径如下图。在dataset文件夹保存了模型训练所需要的全部数据,包括original_dataset和dataset两个文件夹。original_dataset保存的是MD生成的PDB结构,是datset split.ipynb进行数据清洗分割以后的结果,分为两个holo和opo两个文件夹,其中opo就是文献中提及的Unbound的MD的结构快照,共计1000个,文件名分别为0.pdb,1.pdb, 2.pdb,3.pdb …. 999.pdb;原创 2021-01-27 19:30:29 · 1609 阅读 · 0 评论 -
Paper再现:MD+AI自动编码机探测蛋白变构(一):文章分析
需要具备的背景知识:(1) 蛋白质结构文件读取(2) Pytorch(3) 自动编码机(4) sklearn聚类本文是模仿文章:Autoencoder-Based Detection of Dynamic Allostery Triggered by Ligand Binding Based on Molecular Dynamics的工作。作者是Yasushige Yonezawa。一、文章分析Yasushige Yonezawa提出使用自动编码机对MD 的结果进行分析,找出蛋白变构的方法原创 2021-01-26 20:06:37 · 916 阅读 · 0 评论 -
分子结构的子结构查询:SMARTS语言
在化学信息学中,有时候我们要确定化学分子是否包含特定的模式(结子构)之前我们已经提及,fingerprint的SMILES字符串经常用来表示分子。SMARTS是SMILES语言的扩展,可以用于创建查询,类似文本语言的正则表达式。任何的SMILES字符串都可以是SMARTS字符串下面展示,如何从SMILES字符串定义分子,显示分子,并突出与特定SMARTS,模式匹配的原子1. 导入基础模块from rdkit import Chem from rdkit.Chem.Draw import Mol原创 2021-01-23 16:29:22 · 4190 阅读 · 0 评论 -
Deepchem的分子特征化方法之图神经网络特征化 (ConvMolFeaturizer / WeaveFeaturizer)解析
by wufeil在Deepchem提供的分子特征化方法中,有两个方法是适用于图神经网络的,分别为:ConvMolFeaturizer 和WeaveFeaturizer。本期我们就来解析一下这两种图神经网络分子特征化的方法。一、ConvMolFeaturizer根绝官方文档的介绍,这是基于“Duvenaud, David K., et al. “Convolutional networks on graphs for learning molecular fingerprints.” Advance原创 2021-01-03 22:14:47 · 3973 阅读 · 0 评论 -
预测化学分子的nlogP——基于sklearn, deepchem, DGL, Rdkit的图卷积网络模型
之前出了几个博客,都是关于如何使用deepchem的内置数据集、模型、以及分子特征化。到目前为止,都没有使用自己真是的案例进行流程化的尝试。这里就使用自己的test.sdf文件作为输入,到模型的建立和评估,建立一个真实的应用于分子的图神经网络模型案例。import deepchem as dcimport os一、加载SDF数据,特征化,生成机器学习/深度学习可以接受的数据格式tasks:任务的列明, featurizer:分子特征化对象, sanitize:分子标准化(一般均选True,因为原创 2020-12-24 18:52:22 · 2689 阅读 · 19 评论