RDKit | 化学信息学与AI
文章平均质量分 63
RDKit是开源化学信息学与机器学习工具包。本专栏主要介绍RDKit在化学信息学和药学领域的应用:分子读写、分子指纹和描述符、构象与骨架分析、亚结构搜索、聚类分析和化学空间探索、药效团、化学反应、化学信息学数据挖掘以及机器学习、深度学习和人工智能在化学、药学和生物学领域的应用。
DrugAI
Fight Disease With Code ! Fight Disease With Data Technology !
药学、医学、化学和生物与计算机和AI交叉的爱好者从业者。
展开
-
“RDKit | 化学信息学与AI”专栏介绍及专栏内容分类(持续更新......)
“RDKit | 化学信息学与AI”专栏介绍 介绍RDKit相关知识点和运用以及RDKit作为处理化学、生物、药学和材料学科中分子数据作为可输入机器学习和深度学习模型的重要工具应用。内容涵盖了基于RDKit的Python3的分子的读写、化合物的分子指纹和分子描述符计算、化合物的2D/2D比对、化合物相似性搜索、化合物骨架分析和亚结构搜索、RMSD计算与构象生成优化、分子相似图与聚...原创 2019-12-25 17:26:25 · 8970 阅读 · 3 评论 -
RDKit(2023.09.1 )环系统模板
【代码】RDKit(2023.09.1 )环系统模板。原创 2023-11-02 16:02:03 · 234 阅读 · 0 评论 -
[Life Sciences.AI]专栏介绍及内容分类(持续更新......)
主要记录RDKit,分子生成,多肽和蛋白等生物大分子相关的操作和与人工智能的结合。蛋白相关蛋白Ramachandran(拉氏图、拉曼图)的绘制和可视化Biopython | 计算蛋白质的接触图(contact map)RDKit相关RDKit | 读取PDB文件并可视化...原创 2021-11-03 13:09:35 · 1513 阅读 · 0 评论 -
RDChiral | 用于处理立体化学的RDKit封装器
RDChiral用于处理立体化学的RDKit封装器,用于反向合成模板提取和应用。人们对计算机辅助合成设计重新产生了兴趣,其中绝大多数方法都需要应用逆合成反应模板。RDChiral是一个开源的Python包装器,用于在应用以SMARTS字符串编码的逆合成转化时提供一致的立体化学信息处理。RDChiral的设计是为了执行手性四面体中心的引入、破坏、保留和反转,以及双键的顺/反构型。RDChiral的GitHub链接https://github.com/connorcoley/rdchiral原创 2021-01-10 18:51:46 · 2026 阅读 · 0 评论 -
RDKit | 基于RDKit(≥2020.09.1)的相似图绘制新方法
导入库from rdkit import Chemfrom rdkit.Chem import Drawfrom rdkit.Chem.Draw import SimilarityMapsfrom IPython.display import SVGimport numpy as npimport rdkitprint(rdkit.__version__)2020.09.1基于Morgan指纹的相似图绘制atorvastatin = Chem.MolFromSmi...原创 2021-01-05 15:19:02 · 1714 阅读 · 1 评论 -
RDKit | 基于RDKit的氨基酸序列转换为SMILES
一个氨基酸序列代表的化合物转换为MOL对象,并计算出该分子的描述符,用于机器学习。导入库from rdkit import Chemfrom rdkit.Chem import Drawfrom rdkit.Chem.Draw import IPythonConsoleIPythonConsole.ipython_useSVG = True载入数据peptide_smiles = Chem.MolToSmiles(Chem.MolFromFASTA("RGDfK"))print(原创 2020-12-30 13:31:45 · 4451 阅读 · 4 评论 -
RDKit | 基于最大公共子结构(MCS)的分子比对
导入库from rdkit import Chem, rdBasefrom rdkit.Chem import AllChemfrom rdkit.Chem.Draw import IPythonConsolefrom rdkit.Chem import Drawfrom rdkit.Chem import rdDepictorfrom rdkit.Chem import rdFMCSfrom rdkit.Chem import TemplateAlignIPythonConsole.i原创 2020-12-21 17:17:05 · 1927 阅读 · 0 评论 -
Smiles2vec | 用于预测化学性质的深度神经网络
作者丨王建民单位丨超级计算长沙中心,湖南大学研究方向丨药物设计、生物医药大数据Smiles2vec简而言之,它是自然语言处理(NLP)领域的一项技术,可将字符串转换为向量。许多人用SMI...原创 2019-09-18 00:03:45 · 3999 阅读 · 0 评论 -
RDKit | 基于随机森林的化合物活性二分类模型
基于随机森林算法的化合物二分类机器学习模型代码示例#导入依赖包import pandas as pdimport numpy as npfrom rdkit import Chem...原创 2018-11-07 20:23:04 · 2009 阅读 · 5 评论 -
Elsevier的Greg Landrum访谈 | 成功的开源化学信息软(RDKit)的要素是什么?
RDKit是化学信息学和机器学习软件的集合,正在协助解决化学信息的难题。RDKit的创始人和创建者Greg Landrum在Elsevier的推动下接受了UDM(统一数据模型)团队的采访,分享了他的经验,即成功之路是怎样的,一个开源项目要想成功需要具备哪些要素。采访中所学到的知识将有助于塑造统一数据模型项目的未来,该项目正在从财团主导的Pistoia联盟模式向社区主导的模式转变。Greg Landrum一切是如何开始的?Greg是一名化学家。在德国做完博士后后,他搬到了加州,...原创 2020-12-09 17:16:02 · 1316 阅读 · 0 评论 -
RDKit | 可视化官能团, 分子聚类, 相似图, 化合物高亮和骨架网络
利用指纹挑选出不同的分子import pandas as pdligands = pd.read_csv('sample_ligands.csv', index_col=False)['canonical_SMILES'].values.tolist()from rdkit import Chemfrom rdkit.Chem import Drawfrom rdkit.Chem.rdMolDescriptors import GetMorganFingerprintfrom rdkit原创 2020-12-08 19:09:45 · 3514 阅读 · 3 评论 -
RDKit | RDKit处理graph-化合物的邻接矩阵、距离矩阵和维纳指数
化合物的图(graph)表示图可以表示一个原子与另一个原子的连接方式。 只有原子的连接和拓扑结构是重要的,而不是键距。邻接矩阵两个原子之间:如果有结合,则为1; 如果没有结合,则为0。那么,所有的原子间键都可以用下面的矩阵来表示。 这样的表示方法称为图的 "邻接矩阵"(adjacency matrix)。 当有两个键时,有时会用到2。每个原子所连接的键数称为原子的 "度"(degree)。 根据定义,相邻矩阵是对称的。距离矩阵描述两个原子之间最短距离的矩阵称为 .原创 2020-11-01 16:11:49 · 3554 阅读 · 1 评论 -
RDKit | BCUT:基于分子图结构的二维描述符
RDKit实现BCUT描述符Chem.rdMolDescriptors.BCUT2D(mol)Chem.rdMolDescriptors.BCUT2D(mol,atom_props)Chem.rdMolDescriptors.BCUT2D(mol,atom_propname)除非另行指定,否则rdMolDescriptors.BCUT2D方法返回包含8个值的元组。每个值是原子重量 Gasteiger电荷 MolLogP MolMR与用于对角线分量的值原子量的最大内在值...原创 2020-11-01 10:28:14 · 3024 阅读 · 0 评论 -
RDKit | 基于RDKit 的化合物预处理
基于Python和RDKit对化合物数据进行预处理。环境MolVS是专门用于化合物预处理的库。rdkit 2020.03 molvs 0.1.1化合物(Compound)预处理RDKit:SanitizeMolKekure的形成,化合价的确认,芳香性的设定,结合等。参考:http://rdkit.org/docs/source/rdkit.Chem.rdmolops.htmlMolVS : Normarize参考:https://molvs.readth...原创 2020-09-16 19:20:33 · 2852 阅读 · 0 评论 -
RDKit | RDKit分子结构图的详细说明
二维绘制结构式是人类了解分子形状和特性的第一步。 RDKit中有多个绘制引擎,通过使用不同的方法绘制的结构在外观上有所不同。这次将深入研究RDKit的结构图,并说明SVG格式的绘制方法,该方法自2015.03更新起可用。可能有很多细节,但是了解幕后发生的事情通常会很有帮助。导入模块和载入数据首先,导入必要的库和分子。需要2020.03或更高版本的RDKit。from rdkit import rdBase, Chemfrom rdkit.Chem i...原创 2020-06-20 16:59:29 · 5284 阅读 · 4 评论 -
RDKit | 将rdMolDraw2D和RDKit生成的结构图输出到Excel
环境Windows10 Python3.6.8 RDKit 2020.03.3from rdkit import Chemfrom rdkit.Chem import Draw, AllChemfrom rdkit.Chem.Draw import rdMolDraw2Dfrom IPython.display import SVGfrom rdkit.Chem import PandasToolsimport pandas as pdimport numpy...原创 2020-05-29 17:04:34 · 2580 阅读 · 0 评论 -
RDKit | 基于RDKit绘制黑白颜色的分子
基于RDKit绘制黑白颜色的分子导入库from rdkit import Chemfrom rdkit.Chem import Drawfrom rdkit.Chem.Draw import IPythonConsoleimport rdkitrdkit.__version__2020.03.1载入数据ms = [Chem.MolFromSmiles(x) for x in ('Cc1onc(-c2ccccc2)c1C(=O)N[C@@H]1C(=O)N2[C@@.原创 2020-05-17 00:26:04 · 1932 阅读 · 0 评论 -
DGL-LifeSci:面向化学和生物领域的 GNN 算法库
基于深度图学习框架DGL环境准备PyTorch:深度学习框架 DGL:基于PyTorch的库,支持深度学习以处理图形 RDKit:用于构建分子图并从字符串表示形式绘制结构式 DGL-LifeSci:面向化学和生物领域的 GNN 算法库DGL安装 conda install -c dglteam dglDGL-LifeSci安装pip install dgllife...原创 2020-06-20 17:27:12 · 2938 阅读 · 1 评论 -
RDKit | Positional Analogue Scanning:药物设计中多参数优化的有效策略
生物医药研究中,将优化命中或先导化合物转化为高质量化学探针或候选药物所需的设计周期的数量和持续时间减到最少是一个持续的挑战。由于对分子和物理化学性质以及分子内和分子间相互作用的显着影响,对命中或先导化合物进行的小结构修饰可能会对药理学特性产生有意义的影响。快速有效地制备一系列位置类似物的药理学概况,是将次甲基与含芳族或杂芳族环的命中或先导化合物中的杂原子或其他取代基进行系统交换,是使设计周期最小化的一种方法(例如,交换芳族或杂芳族化合物)具有N个原子的CH基或CF,CMe或COH基)。导..原创 2020-05-15 21:01:46 · 1463 阅读 · 0 评论 -
DGL & RDKit | 基于Attentive FP的分子性质线性模型
基于分子图的深度学习在化学和药物领域非常热门。2019年8月13日JMC(Journal of Medicinal Chemistry)刊登了一篇文章“Pushing the Boundaries of Molecular Representation for Drug Discovery with the Graph Attention Mechanism”,介绍了一种基于注意力机制的图神经...原创 2020-05-06 15:18:38 · 3149 阅读 · 0 评论 -
MOSES | 分子生成模型的基准平台
MOSES简介深度生成模型因发现新的分子和材料而迅速流行。 这样的模型可以从大量的分子结构中学习并产生新的化合物。 这项工作中介绍了分子集(MOSES),一个基准平台,可支持针对药物发现的机器学习研究。 MOSES实现了几种流行的分子生成模型,并提供了一组指标来评估所生成分子的质量和多样性。 借助MOSES,旨在标准化分子生成研究,并促进新模型的共享和比较。MOSES安装pip...原创 2020-05-05 16:25:26 · 3569 阅读 · 1 评论 -
RDKit | RDKit(2019.09)新增相似性图函数
RDKit(2019.09)新增相似性图函数导入库from rdkit import Chemfrom rdkit.Chem import Drawfrom rdkit.Chem.Draw import SimilarityMapsfrom IPython.display import SVGimport numpy as npimport rdkitprint(rdkit....原创 2020-04-26 16:46:53 · 1490 阅读 · 0 评论 -
RDKit | 基于RDKit绘制带原子和键的索引、注释和立体化学
基于RDKit绘制带原子和键的索引、注释和立体化学导入库from rdkit import Chemfrom rdkit.Chem import Drawfrom rdkit.Chem.Draw import rdMolDraw2Dfrom rdkit.Chem import rdDepictorrdDepictor.SetPreferCoordGen(True)from r...原创 2020-04-26 16:00:01 · 2176 阅读 · 0 评论 -
开源化学信息学库 :ScaffoldGraph
ScaffoldGraph是一个开放源代码化学信息库,使用RDKit和NetworkX构建,用于生成和分析骨架网络和支架树。1特点 骨架网络生成(Varin, 2011)通过迭代删除可...原创 2020-04-07 00:13:00 · 2088 阅读 · 0 评论 -
RDKit | 通过分析活性化合物确定指标阈值
RDKit | PD/PD-L1抑制活性 化合物指标分析RDKit | 基于SSSR区分环状化合物和链状化合物原创 2020-04-17 09:54:54 · 1417 阅读 · 0 评论 -
RDKit | RDKit中的药效团特征
import osfrom rdkit import RDConfigfrom rdkit.Chem import AllChemfrom rdkit import Chemfdef = AllChem.BuildFeatureFactory(os.path.join(RDConfig.RDDataDir,'BaseFeatures.fdef'))print(fd...原创 2020-04-01 17:21:10 · 2206 阅读 · 0 评论 -
RDKit | 基于RDKit可视化脂溶性在溶解度贡献中的应用
尝试了logP,仅使用原子的权重即可可视化。导入库import base64from io import BytesIOimport warningswarnings.filterwarnings(action='ignore')from IPython.core.display import display, HTMLdisplay(HTML("<style>....原创 2020-03-31 16:09:13 · 1419 阅读 · 0 评论 -
RDKit | 基于SSSR区分环状化合物和链状化合物
基于RDKit描述的SSSR概念进行相同的分类。导入库from rdkit import rdBase, Chemfrom rdkit.Chem import AllChem, Draw, Descriptors, PandasToolsimport pandas as pd载入数据df = pd.read_csv('PD1_inhibitor_dataset.csv')...原创 2020-03-31 11:23:08 · 2143 阅读 · 0 评论 -
RDKit | 基于RDKit探索ChEMBL数据库中合成药物历史
从ChEMBL采集数据 使用RDKit绘制结构和计算索引 绘制气泡图 在复合空间中绘制 完结https://magattaca.hatenablog.com/#Bubble%E3%83%81%E3%83%A3%E3%83%BC%E3%83%88%E3%82%92%E3%83%97%E3%83%AD%E3%83%83%E3%83%88...原创 2020-03-30 15:15:35 · 2055 阅读 · 0 评论 -
RDKit | 基于RDKit中和带电分子
化合物的预处理导入库from rdkit import Chemfrom rdkit.Chem import MolStandardize载入数据smis = ("c1cccc[nH+]1", "C[N+](C)(C)C", "c1ccccc1[NH3+]", "CC(=O)[O-]", "c1ccccc1[O-]", "CCS...原创 2020-03-26 21:32:26 · 2026 阅读 · 3 评论 -
RDKit | 基于RDKit的指定原子或键高亮
基于RDKit的指定原子或键高亮指定原子或键高亮HilightChemAtom.pyfrom rdkit import Chemfrom rdkit.Chem.Draw import rdMolDraw2Dfrom IPython.display import SVGfrom io import BytesIOfrom PIL import Imagefrom cairo...原创 2020-03-27 20:13:36 · 2009 阅读 · 0 评论 -
RDKit | 基于RDKit的SMILES转canonical SMILES
基于RDKit的SMILES String转canonical SMILESString导入库from rdkit import Chemfrom rdkit.Chem import Drawfrom rdkit.Chem.Draw import IPythonConsoleSMILES转RDKit的Mol对象testsmi = '[H][C@@]12CC[C@H](...原创 2020-03-24 15:21:06 · 7685 阅读 · 10 评论 -
RDKit | 基于RDKit和Cytoscape绘制分子相似图
import osimport numpy as npimport igraphfrom py2cytoscape import utilfrom cyjupyter import Cytoscapefrom rdkit import Chemfrom rdkit.Chem import DataStructsfrom rdkit.Chem import AllChemfr...原创 2020-03-23 17:41:55 · 1733 阅读 · 0 评论 -
RDKit |基于集成学习(Ensemble learning)预测溶解度
Ensemble learningfrom rdkit import Chemfrom rdkit.Chem import DataStructsfrom rdkit.Chem import AllChemfrom rdkit import RDPathsfrom rdkit.Chem.Draw import IPythonConsolefrom rdkit.C...原创 2020-05-05 20:25:18 · 1869 阅读 · 0 评论 -
RDKit | 基于RDKit从分子中提取3D药效团特征
从分子中提取3D药效团特征导入库import osfrom rdkit import Geometryfrom rdkit import RDConfigfrom rdkit.Chem import AllChemfrom rdkit.Chem import ChemicalFeaturesfrom rdkit.Chem.Pharm3D import Pharmacophore...原创 2020-03-22 16:37:45 · 2779 阅读 · 0 评论 -
RDKit | 基于RDKit获取分子3D距离矩阵
from rdkit import Chemfrom rdkit.Chem import AllChemfrom rdkit.Chem import rdDistGeom as molDG mol = Chem.MolFromSmiles('CCC')bm = molDG.GetMoleculeBoundsMatrix(mol)bmOut[]: array([[0. ...原创 2020-03-22 16:36:46 · 2650 阅读 · 0 评论 -
RDKit | 基于RDKit计算3D药效团指纹
3D Pharmacophore指纹导入库from rdkit import Chem, DataStructs, RDConfigfrom rdkit.Chem import AllChemfrom rdkit.Chem.Pharm2D import Gobbi_Pharm2D, Generate载入数据,产生3D结构mol = Chem.MolFromSmiles( '...原创 2020-03-18 20:27:50 · 2592 阅读 · 1 评论 -
RDKit | 基于scikit-learn将pytorch用于QSAR模型构建
将PyTorch用于深度学习框架。PyTorch非常灵活,并且有很多文章将其用于实现。利用scikit-learn一样调用fit来训练pytorch模型,使用skorch可以使训练过程变得简单。skorch skorch 一个基于pytorch封装兼容scikit-learn的神经网络库skorch 安装pip install skorch...原创 2020-04-11 21:20:25 · 2552 阅读 · 0 评论 -
DGL & RDKit | 基于Attentive FP可视化训练模型原子权重
DGL具有许多用于化学信息学、药物与生物信息学任务的函数。DGL开发人员提供了用于可视化训练模型原子权重的代码。使用Attentive FP构建模型后,可以可视化给定分子的原子权重,意味着每个原子对目标值的贡献量。基于Attentive FP可视化训练模型原子权重环境准备PyTorch:深度学习框架 DGL:基于PyTorch的库,支持深度学习以处理图形 RDKit:用于构建分...原创 2020-03-14 22:21:28 · 4608 阅读 · 1 评论 -
DGL & RDKit | 基于GCN的多任务分类模型
关于化学信息学领域基于图的方法的出版物很多。我无法涵盖所有内容,但仍然对这些领域感兴趣。我认为pytorch_geometric(PyG)和深图库(DGL)对于化学信息学家来说是非常有吸引力且有用的软件包。我写了一些有关DGL和PyG的帖子。最近的DGL对化学信息学更加友好,因此我今天将DGL用于GCN模型构建。最初,我尝试使用Skorch的DGL,但失败了。因此,我仅将DGL用...原创 2020-03-21 20:42:13 · 3231 阅读 · 2 评论