![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
图神经网络
文章平均质量分 81
wufeil
这个作者很懒,什么都没留下…
展开
-
SQUID - 形状条件下的基于分子片段的3D分子生成等变模型 评测
基于形状的虚拟筛选在基于配体的药物设计中至关重要,主要目的是识别与已知配体具有相似 3D 形状的分子。传统方法(例如:openeye 的 ROCS)依赖于枚举的化学库,这限制了新化学空间的探索。为此,作者开发了SQUID模型。SQUID 是在 形状条件下 3D 分子生成模型,可以用于在形状条件下的化学空间探索任务。原创 2024-07-21 15:05:42 · 769 阅读 · 0 评论 -
药物设计中的SE3等变图神经网络层- EGNN 代码解析
此部分内容介绍了常用在药物设计深度学习中的SE3等变网络层 EGNN。主要对EGNN的代码逻辑、模块进行解析,并介绍其中的SE3等变在模型中的原理。原创 2024-06-04 23:43:49 · 1215 阅读 · 0 评论 -
口袋条件下的Lead优化几何深度模型-Delete 评测
Delete 模型是浙江大学侯廷军老师发表2023年8月4日在arXiv上的文章,文章名:Delete: Deep Lead Optimization Enveloped in Protein Pocket。Delete 模型基于mask策略,按照作者的描述,首先是随机掩码预训练模型,然后是应用于骨架跃迁、linker设计,片段延伸、侧链修饰的四个微调模型。通过,vina energy等分析,发现 Delete 模型生成的分子可能具有更好的活性。原创 2024-03-24 20:37:56 · 1299 阅读 · 2 评论 -
Schrodinger 分子形状筛选工具Shape Screen 使用方法
schrodinger的shape screen方法是一种基于ligand的筛选方法。需要提供一个参考分子,和需要筛选的分子库。shape screen可以根据原子类型、药效团对分子的形状相似度进行打分。原创 2023-11-19 11:38:14 · 300 阅读 · 0 评论 -
基于片段的分子生成网络 (FLAG)使用方法及案例测评
作者提出了一个基于片段的分子生成网络,FLAG (Fragment based LigAnd Generation framework)。在FLAG中,从数据集中提取共同的分子片段,构建了motif的词汇库。在每个生成步骤中,首先采用 3D 图神经网络对中间上下文信息(口袋)进行编码。然后,FLAG模型选择中心motif,预测下一个motif类型,并连接motif。原创 2023-10-12 23:09:32 · 639 阅读 · 12 评论 -
基于SE3等变网络与Diffusion模型的分子生成工具 TargetDiff 评测
TargetDiff是来源于ICLR2023文章:3D Equivariant Diffusion for Target-Aware Molecule Generation and Affinity Prediction。该文章基于 SE(3)-equivariant network,开发了非自回归的,具有旋转和平移不变性的,口袋为条件的分子扩散生成模型TargetDiff。原创 2023-06-09 08:03:05 · 1316 阅读 · 10 评论 -
分子骨架跃迁工具DiffLinker评测
DiffLinker是一个用于分子骨架跃迁的E3等变3D条件扩散模型。。与之前介绍的Delinker, 3DLinker等不同,DiffLinker可以连接任意的分子片段,而3Dlinker等仅仅可以链接一对(2个)分子片段。同时,DiffLinker也不需要指定链接处和需要添加的原子数量,这些都可以自动生成。此外,可以使用口袋作为条件,进行骨架跃迁任务,并且提供了详细的使用文档。原创 2023-02-05 15:44:42 · 1422 阅读 · 4 评论 -
分子骨架跃迁工具3DLinker 评测
与之前介绍的骨架跃迁工具不同,3DLinker是变分自动编码器模型,可以在分子linker 设计同时生成分子和分子的坐标。文章引入了空间归纳偏差:equivariance E(3) transformations (等方差E3变换)。3DLinker以两个分子片段作为输入,输出中间的Linker部分,在输出分子结构的同时还输出linker的坐标。原创 2022-10-24 21:48:22 · 2358 阅读 · 1 评论 -
图神经网络预训练 (5) - 总结
到目前为止,Conetext prediction 和 Attribute Prediction 两种节点和边层面的预训练方法,及其之后的图层面的分子性质监督学习预测,都已经介绍完毕。基本上,Strategies for Pre-training Graph Neural Networks 简介已经结束,并且提供了可以直接运行的代码及其环境。代码见之前文章的链接。现在来总结一下,其中包含的有用的内容:1. 分子由SMILES生成pyg图;2. 分子pyg图组成批次的datal...原创 2022-05-28 18:26:21 · 582 阅读 · 4 评论 -
图神经网络预训练 (4) - 节点属性预测 Attribute Prediction + 监督学习 代码
继续剖析Strategies for Pre-training Graph Neural Networks,介绍另一种节点层面的预训练方法,节点属性预测的预训练方法(Attribute Prediction)及其随后的监督学习用于分子性质预测部分。 可运行版本的代码下载,请见文末。原创 2022-05-28 17:13:56 · 4068 阅读 · 6 评论 -
图神经网络预训练 (3) - Context Prediction + 监督学习 代码
前两篇内容概述了Weihua Hu*, Bowen Liu*图神经网络预训练的方法,以及context prediction进行预训练的实施代码。context prediction 学习的图内的原子/边信息的表征,并没有包括图层面的信息。这一部分的监督学习,是图层次的监督学习,目的是把图层面的信息增加到图的表征向量G(h)中。经过图层次的监督学习,得到的模型就可以直接用于下游的任务。文章方法:在节点层面预训练的模型后加上一个简单的线性模型,用于图层面的监督训练网络结构如下图:..原创 2022-05-26 12:44:50 · 2273 阅读 · 3 评论 -
图神经网络预训练 (2) - 子结构预测 Context Prediction 代码
如上篇文章所提及,Strategies for Pre-training Graph Neural Networks一文的作者提出了节点层面进行预训练的两种方法,分别是:Context 和 Attribute Prediction。这两种预训练方法可以让模型学会节点层面嵌入。将预训练得到的模型用于下游图层面的任务时,可以很好的保留节点层面的信息,活得更好的泛化能力。接下来,这一部分就来具体介绍子结构预测 Context Prediction,并提供一个可以直接运行的代码版本。一、 Conte..原创 2022-05-23 23:51:29 · 1962 阅读 · 5 评论 -
图神经网络预训练(1) - Strategies for Pre-training Graph Neural Networks 简介
我们这次要复制的对象是一篇非常经典的关于图神经网络预训练策略的文章,是斯坦福大学Weihua Hu 课题组的工作,发表于2019年。参考文献Weihua Hu*, Bowen Liu*, Joseph Gomes, Marinka Zitnik, Percy Liang, Vijay Pande, Jure Leskovec. Strategies for Pre-training Graph Neural Networks. ICLR 2020他们开发了一种自监督的预训练方法,单个节点以及原创 2022-05-22 13:31:26 · 1177 阅读 · 0 评论 -
Gromacs 2021.5安装教程
GROMACS安装教程原创 2022-03-14 13:49:41 · 6715 阅读 · 0 评论 -
利用 AWS pcluster + Vina 进行百万级分子库虚拟筛选
利用AWS 的pcluster工具 + Vina 进行百万级的分子虚拟筛选原创 2021-12-21 00:36:51 · 2479 阅读 · 0 评论 -
将分子SMILES生成DGLGraph
其实将分子的SMILES转化为图是很简单的,也是很便捷的,主要有以下几步:一、导入相关的包import numpy as npimport torchimport dglfrom dgl import DGLGraphfrom rdkit import Chemfrom rdkit.Chem import rdMolDescriptors as rdDesc二、将SMILES转化为RDKIT的mol对象,同时生成一个空的dgl图molecule_smiles='[C@@H](Cl)(F)原创 2021-04-22 23:20:32 · 6267 阅读 · 11 评论 -
Paper再现:MD+AI自动编码机探测蛋白变构(四):DIO的生成和聚类
四、 DIO的生成和聚类这一部分比较简单,就是一个sklearn的聚类分析而已,所以没必要说什么,直接上代码。这里一个主要问题是,sklearn里面的聚类方法,是单核运行的,于是运行的速度很慢,这个蛋白只有500左右的残基,已经需要3个小时。所以,应该找其他方法代替。4.1导入相关模块#加载模块import pandas as pdimport numpy as npimport timeimport torch import torch.nn as nnimport torch.nn.原创 2021-04-07 00:03:08 · 388 阅读 · 2 评论 -
Paper再现:MD+AI自动编码机探测蛋白变构(三):训练自编码模型
三、训练自编码模型文章中是用的自动编码机是很简答的模型,如下图。由于这一部分是比较简单的,有一点神经网络基础的都很快可以完成,所以就写的简单一些哈。我们也来模仿这个简单的自动编码机模型。使用pytorch来建模。3.1 导入相关模块#导入相关模块import timeimport torchimport torch.nn as nnimport torch.nn.functional as Ffrom torch import optimfrom torch.optim import原创 2021-02-08 00:12:17 · 363 阅读 · 1 评论 -
Paper再现:MD+AI自动编码机探测蛋白变构(二):MD数据处理及特征化
2.1 数据的预处理先来讲讲项目的结构吧。整个项目的文件路径如下图。在dataset文件夹保存了模型训练所需要的全部数据,包括original_dataset和dataset两个文件夹。original_dataset保存的是MD生成的PDB结构,是datset split.ipynb进行数据清洗分割以后的结果,分为两个holo和opo两个文件夹,其中opo就是文献中提及的Unbound的MD的结构快照,共计1000个,文件名分别为0.pdb,1.pdb, 2.pdb,3.pdb …. 999.pdb;原创 2021-01-27 19:30:29 · 1571 阅读 · 0 评论 -
Paper再现:MD+AI自动编码机探测蛋白变构(一):文章分析
需要具备的背景知识:(1) 蛋白质结构文件读取(2) Pytorch(3) 自动编码机(4) sklearn聚类本文是模仿文章:Autoencoder-Based Detection of Dynamic Allostery Triggered by Ligand Binding Based on Molecular Dynamics的工作。作者是Yasushige Yonezawa。一、文章分析Yasushige Yonezawa提出使用自动编码机对MD 的结果进行分析,找出蛋白变构的方法原创 2021-01-26 20:06:37 · 896 阅读 · 0 评论 -
分子结构的子结构查询:SMARTS语言
在化学信息学中,有时候我们要确定化学分子是否包含特定的模式(结子构)之前我们已经提及,fingerprint的SMILES字符串经常用来表示分子。SMARTS是SMILES语言的扩展,可以用于创建查询,类似文本语言的正则表达式。任何的SMILES字符串都可以是SMARTS字符串下面展示,如何从SMILES字符串定义分子,显示分子,并突出与特定SMARTS,模式匹配的原子1. 导入基础模块from rdkit import Chem from rdkit.Chem.Draw import Mol原创 2021-01-23 16:29:22 · 3980 阅读 · 0 评论 -
Deepchem的分子特征化方法之图神经网络特征化 (ConvMolFeaturizer / WeaveFeaturizer)解析
by wufeil在Deepchem提供的分子特征化方法中,有两个方法是适用于图神经网络的,分别为:ConvMolFeaturizer 和WeaveFeaturizer。本期我们就来解析一下这两种图神经网络分子特征化的方法。一、ConvMolFeaturizer根绝官方文档的介绍,这是基于“Duvenaud, David K., et al. “Convolutional networks on graphs for learning molecular fingerprints.” Advance原创 2021-01-03 22:14:47 · 3740 阅读 · 0 评论 -
预测化学分子的nlogP——基于sklearn, deepchem, DGL, Rdkit的图卷积网络模型
之前出了几个博客,都是关于如何使用deepchem的内置数据集、模型、以及分子特征化。到目前为止,都没有使用自己真是的案例进行流程化的尝试。这里就使用自己的test.sdf文件作为输入,到模型的建立和评估,建立一个真实的应用于分子的图神经网络模型案例。import deepchem as dcimport os一、加载SDF数据,特征化,生成机器学习/深度学习可以接受的数据格式tasks:任务的列明, featurizer:分子特征化对象, sanitize:分子标准化(一般均选True,因为原创 2020-12-24 18:52:22 · 2566 阅读 · 19 评论 -
进一步认识Deepchem的分子特征化: 将化学分子结构作为到随机森林\CNN\RNN\GNN等机器学习模型输入的三种方法
'''by wufeil进一步认识分子特征化:将化学分子结构作为到随机森林\CNN\RNN\GNN等机器学习模型的输入 如何将一个分子SMile表示的分子输入到机器学习/深度学习中呢?例如:CH3CH3CH3 这里将进行介绍。 使用机器学习处理分子数据最重要的一步就是将分子转换成机器学习算法可以处理的数据格式。 deepchem特征化分子的方法为Featurizer类。有三种方式的特征化分子: (1) 直接使用molnet内置数据集的时候,只.原创 2020-12-18 17:36:10 · 4682 阅读 · 9 评论 -
DeepChem-使用图卷积神经网络对化学分子建模
'''by wufeilDeepChem-使用图卷积神经网络对化学分子建模在深度学习中,图卷积神经网络特别适合处理化学分子数据,也经常被用于处理分子数据。这是因为化学分子本身就是一个图数据。但是如何将分子转化为图神经网络可以使用的数据格式呢?接下来就做简单的介绍。首先,标准的卷积网络,最简单最传统的就是CNN,convolutional neural network,是处理图片最常用的神经网络模型。CNN的输入是像素矩阵,每一个像素都是一个含有三个元素的向量,代表红黄蓝的数值。所..原创 2020-12-15 13:17:10 · 5432 阅读 · 2 评论 -
DeepChem-使用自定义Keras\Torch深度学习模型示例
'''by wufeilTutorial Part 5: Creating Models with TensorFlow and PyTorchDeepChem支持大量的机器学习模型,包括:scikit-learn, xgboost, TensorFlow, and PyTorch详情可以看下表:'''![在这里插入图片描述](https://img-blog.csdnimg.cn/20201214150754591.png?x-oss-process=image/watermark,.原创 2020-12-14 15:10:39 · 1022 阅读 · 0 评论 -
Deepchem构建基于分子指纹的神经网络模型
'''by wufeil分子指纹在深度学习中,模型的输入往往是矩阵化的数组,甚至需要相同的长度。由于分子的原子数量不同,将分子直接转别成相同长度的数组很有难度。但,这一问题已经得到解决。当前,在深度学习中,表示化学结构的方法有很多种,这里要介绍的分子指纹是其中较为简单的一种,经常用于表示有药性的分子。分子指纹是固定长度的阵列,其中不同元素表示分子中存在不同特征。如果两个分子具有相似的指纹,则表明它们包含许多相同的特征,因此可能具有相似的化学性质。DeepChem支持一种特殊类.原创 2020-12-09 11:38:05 · 1940 阅读 · 0 评论 -
DeepChem的内置数据集及使用方法
'''by wufeilDeepChem的内置数据集及使用方法Tutorial 3: An Introduction To MoleculeNetDeepchem含有大量的内置数据集,主要是一些分子的数据,所以,数据集的名字为:MoleculeNet (分子网络)数据集一直在更新,目前已经有46个数据集,deepchem的数据集包含在molnet模块内, 使用load_+模块名称加载数据如下:'''import deepchem as dctasks, datasets, .原创 2020-12-07 14:31:24 · 1115 阅读 · 0 评论 -
Deepchem数据类型——如何将分子输入到神经网络模型中
'''by wufeildeepchem教程2Tutorial 2: Working With Datasetsdeepchem内置数据集及其简单建模'''import deepchem as dcprint(dc.__version__)'''加载seepchem内置数据'''tasks, datasets, transformers = dc.molnet.load_delaney(featurizer='GraphConv')train_dataset, val.原创 2020-12-04 11:43:43 · 905 阅读 · 0 评论 -
图神经网络框架DGL学习 104——图分类模型(Graph Classification Tutorial)
学习利用DGL进行批次化训练图分类模型。这是一个图层面的任务。 图形分类是生物信息学,化学信息学,社会网络分析,城市计算和网络安全等许多领域应用的重要问题。 将图神经网络应用于此问题是最近流行的方法。一、数据集 已知有一以下几种类型的形状及其类型,需训练一个相应的分类模型。该数据集为DGL的MiniGCDataset。首先,导入所有要使用的模块。import dglfrom dgl.data import MiniGCDatasetfrom dgl.nn.p...翻译 2020-07-23 17:09:54 · 4197 阅读 · 0 评论 -
图神经网络框架DGL学习 103——信息传递 (Message Passing Tutorial)
在图神经网络中,信息的传递和特征的转变,用户可以自定义的。当然在DGL中,也有高级别的API供调用。现在来看一个网页排名简单的模型。每一个节点都有相同的PV值,PV=0.01, 每一个节点首先会均匀分散自己的PV值给周围的节点。各节点新的PV值等于周围节点的聚合,同时受到阻尼因子的调节。因此,每一次迭代,节点PV值的变化如下:其中,d为阻尼因子,N为节点数。N为节点的邻接节点,D为节点的输出度(deg)目的:查看10次迭代之后,各节点的PV值首先,导入需要的模块import matplotlib原创 2020-07-10 16:17:05 · 1547 阅读 · 0 评论 -
图神经网络框架DGL学习 102——图、节点、边及其特征赋值
101(入门)以后就是开始具体逐项学习图神经网络的各个细节。下面介绍:1.如何构建图2.将特征赋给节点或者边,及查询方法这算是图神经网络最基础最基础的部分了。一、如何构建图DGL中创建的图的方法有:1. 通过(u, v),u和v分别为起始节点和终止节点的列表,可以是numpy矩阵也可以是tensor2. scipy中的稀疏矩阵,该稀疏矩阵储存这图的邻接矩阵3. networkx图对象转化4. 逐步添加节点与边先导入所有可能需要的模块import networkx as nximpor原创 2020-07-03 15:33:28 · 7109 阅读 · 0 评论 -
图神经网络框架DGL学习——101(入门)
图神经网络框架DGL学习——101关于DGLDGL是一个主流的开源的图神经网络,支持tensorflow, torch等语言,用的较多的是torch。具体介绍,请见官方主页:https://docs.dgl.ai/index.html101(入门)图神经网络的几个关键流程:1.图的构建2.特征传递给边或者节点3.图神经网络模型的构建4.模型训练5.模型可视化DGL可以帮助我们更快的建立一个图神经网络,主要体现在图的构建、特征赋予节点/边、自带各类图神经网络层、可视化上。以下是官方文档的入原创 2020-07-02 14:01:21 · 3162 阅读 · 3 评论