DrugAI
Fight Disease With Code ! Fight Disease With Data Technology !
药学、医学、化学和生物与计算机和AI交叉的爱好者从业者。
展开
-
OpenMM | 蛋白质的分子动力学轨迹分析
基于OpenMM模拟的蛋白质分子动力学轨迹分析()MDAnalysis原创 2022-08-23 16:52:33 · 1013 阅读 · 0 评论 -
基于LSTM的分子生成入门
基于LSTM的分子生成入门。原创 2022-08-23 15:36:06 · 867 阅读 · 0 评论 -
RDKit | 使用 RDKit 通过氨基酸对肽进行着色
使用 RDKit 通过氨基酸对肽进行着色原创 2022-08-23 10:10:02 · 584 阅读 · 0 评论 -
RDKit | 建立溶解度预测的LightGBM回归模型
基于RDKit建立溶解度预测的LightGBM回归模型原创 2022-08-22 10:06:15 · 797 阅读 · 0 评论 -
OpenMM | PDBFixer 用于蛋白质预处理
PDBFixer 用于蛋白质预处理原创 2022-02-16 14:49:53 · 2293 阅读 · 0 评论 -
RDKit | 基于RDKit探索化学空间-smiles悬停
环境Win10 RDKit2021.09.2 Python=3.7基于RDKit探索化学空间-smiles悬停导入库import sysimport osimport pandas as pdimport numpy as npimport altair as altfrom rdkit import Chemfrom rdkit import rdBasefrom rdkit.Chem import AllChemfrom rdkit.Chem import原创 2022-02-12 18:13:28 · 1860 阅读 · 0 评论 -
[Life Sciences.AI]专栏介绍及内容分类(持续更新......)
主要记录RDKit,分子生成,多肽和蛋白等生物大分子相关的操作和与人工智能的结合。蛋白相关蛋白Ramachandran(拉氏图、拉曼图)的绘制和可视化Biopython | 计算蛋白质的接触图(contact map)RDKit相关RDKit | 读取PDB文件并可视化...原创 2021-11-03 13:09:35 · 1528 阅读 · 0 评论 -
Biopython | 计算蛋白质的接触图(contact map)
contact map蛋白质接触图使用二元二维矩阵表示三维蛋白质结构的所有可能的氨基酸残基对之间的距离。计算contact map导入库import pandas as pdimport numpy as npfrom Bio import SeqIOimport matplotlib.pyplot as pltimport requests from sklearn.metrics import pairwise_distances%matplotlib inl...原创 2021-11-03 12:57:22 · 6923 阅读 · 0 评论 -
蛋白Ramachandran(拉氏图、拉曼图)的绘制和可视化
蛋白Ramachandran(拉氏图、拉曼图)的绘制环境Win10 Biopython = 1.79 Python = 3.7.9导入库import mathimport sysimport osimport matplotlib.pyplot as pltimport numpy as npfrom Bio import PDBfrom matplotlib import colors定义Ramachandran plot函数def plot_ramacha原创 2021-10-08 13:23:17 · 4258 阅读 · 2 评论 -
RDKit | 基于RDKit和化学信息学探索化学空间
基于RDKit和化学信息学探索化学空间原创 2021-09-30 10:22:38 · 1463 阅读 · 0 评论 -
RDKit | 读取PDB文件并可视化
导入库from rdkit import rdBasefrom rdkit import Chemfrom rdkit.Chem import Drawfrom rdkit.Chem import AllChemprint('rdkit version: ',rdBase.rdkitVersion)读取pdb文件mol = AllChem.MolFromPDBFile('mol.pdb')molMol对象转换smilesmolsmiles = Chem.MolToSm原创 2021-07-07 15:55:36 · 4410 阅读 · 0 评论 -
RDKit | 基于多片段的分子生成(骨架A+骨架B+骨架C)
通过BRICS算法产生片段库 通过结合三个片段(A,B,C)生成ABC型分子。环境Win10 RDKit2020.09.1 Python=3.7.9基于多片段的分子生成导入库import numpy as npimport itertoolsfrom rdkit import rdBase, Chemfrom rdkit.Chem import AllChem, Draw, BRICS, Descriptorsfrom rdkit.ML.Descriptors import原创 2021-01-15 21:55:33 · 2140 阅读 · 0 评论 -
RDKit | 基于片段的分子生成(骨架A+骨架B)
环境Win10 RDKit2020.09.1 Python=3.7.9基于双片段的分子生成导入库import numpy as npfrom rdkit import rdBase, Chemfrom rdkit.Chem import AllChem, Draw, BRICS, Descriptorsfrom rdkit.ML.Descriptors import MoleculeDescriptorsprint(rdBase.rdkitVersion)...原创 2021-01-15 21:31:09 · 2404 阅读 · 1 评论 -
RDKit | 基于RDKit操纵分子结构(骨架转换)
环境Win10 RDKit2020.09.1 Python=3.7.9RDKit操纵分子结构导入库import pandas as pdimport numpy as npfrom rdkit import Chemfrom rdkit.Chem import AllChem, DrawMol对象和SMILES之间转换mol = Chem.MolFromSmiles('c1ccccc1')print(mol)smiles = Chem.MolToSmiles(mol原创 2021-01-15 20:56:32 · 2278 阅读 · 0 评论 -
RDChiral | 用于处理立体化学的RDKit封装器
RDChiral用于处理立体化学的RDKit封装器,用于反向合成模板提取和应用。人们对计算机辅助合成设计重新产生了兴趣,其中绝大多数方法都需要应用逆合成反应模板。RDChiral是一个开源的Python包装器,用于在应用以SMARTS字符串编码的逆合成转化时提供一致的立体化学信息处理。RDChiral的设计是为了执行手性四面体中心的引入、破坏、保留和反转,以及双键的顺/反构型。RDChiral的GitHub链接https://github.com/connorcoley/rdchiral原创 2021-01-10 18:51:46 · 2053 阅读 · 0 评论 -
RDKit | 基于随机森林(RF)预测SARS-CoV 3CL蛋白酶抑制剂的pIC50
导入库import sklearnfrom rdkit.Chem import AllChemfrom rdkit import Chemfrom rdkit.Chem import Descriptorsfrom sklearn.model_selection import train_test_splitfrom rdkit.ML.Descriptors import MoleculeDescriptorsimport pandas as pdfrom sklearn.pipe...原创 2021-01-07 15:10:36 · 1769 阅读 · 5 评论 -
RDKit | 基于RDKit的肽和核酸序列转换分子Mol对象
RDKit文档中MolFromHELM(),从HELM字符串构建分子(当前仅支持肽)”。另一方面,正如GitHub问题中指出的那样,除了肽之外,实际上还可以从核酸序列创建Mol对象。导入库from rdkit import rdBase, Chemfrom rdkit.Chem import AllChem, Drawfrom rdkit.Chem.Draw import IPythonConsole, rdMolDraw2Dfrom IPython.display import S..原创 2021-01-06 16:26:23 · 1606 阅读 · 2 评论 -
DeepChem | 基于DeepChem的GCN预测化合物溶解度
导入库from __future__ import print_functionfrom __future__ import divisionfrom __future__ import unicode_literalsfrom rdkit import Chemfrom rdkit.Chem.Draw import IPythonConsolefrom rdkit.Chem import Drawimport deepchem as dcimport numpy as np...原创 2021-01-05 18:57:58 · 2285 阅读 · 2 评论 -
DeepChem | PyTorch中用自定义层实现DeepChem的GraphConvLayer
PyTorch中用自定义层实现DeepChem的GraphConvLayer环境DeepChem 2.4 PyTorch 1.7.0 Python3.7.9PyTorch中用自定义层实现DeepChem的GraphConvLayer导入库import torchfrom torch.utils import datafrom deepchem.feat.graph_features import ConvMolFeaturizerfrom deepchem.feat.mol_g原创 2021-01-05 18:41:15 · 1615 阅读 · 2 评论 -
DeepChem | Windows 10下anaconda3环境从源码构建并安装deepchem
环境依赖微软构建工具2015年更新3 https://visualstudio.microsoft.com/ja/downloads/Anaconda3 Python 3.7.9编译安装创建deepchem虚拟环境conda create -n deepchem python=3.7激活虚拟环境并安装依赖包conda activate deepchem(deepchem) >conda install tensorflow(deepchem...原创 2021-01-05 18:28:13 · 1672 阅读 · 3 评论 -
RDKit | 基于RDKit(≥2020.09.1)的相似图绘制新方法
导入库from rdkit import Chemfrom rdkit.Chem import Drawfrom rdkit.Chem.Draw import SimilarityMapsfrom IPython.display import SVGimport numpy as npimport rdkitprint(rdkit.__version__)2020.09.1基于Morgan指纹的相似图绘制atorvastatin = Chem.MolFromSmi...原创 2021-01-05 15:19:02 · 1731 阅读 · 1 评论 -
RDKit | 基于R基团分解(R-group decomposition)高亮分子
一组共享一个共同骨架的分子上做R基分解(RGD,R-group decomposition),为那些对准骨架的分子生成坐标,并生成分子图像,其中的R基团被涂上了颜色,使它们容易被挑选出来。注:RDKit版本≥2020.09.1导入库import rdkitfrom rdkit import Chemfrom rdkit.Chem import Drawfrom rdkit.Chem.Draw import IPythonConsoleIPythonConsole.molS.原创 2021-01-05 15:01:07 · 2129 阅读 · 4 评论 -
RDKit | 基于最大公共子结构(MCS)的分子比对
导入库from rdkit import Chem, rdBasefrom rdkit.Chem import AllChemfrom rdkit.Chem.Draw import IPythonConsolefrom rdkit.Chem import Drawfrom rdkit.Chem import rdDepictorfrom rdkit.Chem import rdFMCSfrom rdkit.Chem import TemplateAlignIPythonConsole.i原创 2020-12-21 17:17:05 · 1947 阅读 · 0 评论 -
数据科学| 蛋白向量分析
Exploring protein vector embeddings导入库import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import manifoldfrom sklearn.metrics.p...原创 2019-10-10 12:18:29 · 1190 阅读 · 0 评论 -
Elsevier的Greg Landrum访谈 | 成功的开源化学信息软(RDKit)的要素是什么?
RDKit是化学信息学和机器学习软件的集合,正在协助解决化学信息的难题。RDKit的创始人和创建者Greg Landrum在Elsevier的推动下接受了UDM(统一数据模型)团队的采访,分享了他的经验,即成功之路是怎样的,一个开源项目要想成功需要具备哪些要素。采访中所学到的知识将有助于塑造统一数据模型项目的未来,该项目正在从财团主导的Pistoia联盟模式向社区主导的模式转变。Greg Landrum一切是如何开始的?Greg是一名化学家。在德国做完博士后后,他搬到了加州,...原创 2020-12-09 17:16:02 · 1327 阅读 · 0 评论 -
RDKit | 可视化官能团, 分子聚类, 相似图, 化合物高亮和骨架网络
利用指纹挑选出不同的分子import pandas as pdligands = pd.read_csv('sample_ligands.csv', index_col=False)['canonical_SMILES'].values.tolist()from rdkit import Chemfrom rdkit.Chem import Drawfrom rdkit.Chem.rdMolDescriptors import GetMorganFingerprintfrom rdkit原创 2020-12-08 19:09:45 · 3555 阅读 · 3 评论 -
RDKit | 多肽HELM字符串格式与分子Mol格式间的转换
导入库from rdkit import rdBase, Chemfrom rdkit.Chem import Draw, rdDepictorfrom rdkit.Chem.Draw import IPythonConsoleprint('rdkit version: ', rdBase.rdkitVersion)rdkit version: 2020.03.2Oxytocin_mol = Chem.MolFromHELM('PEPTIDE1{C.Y.I.Q.N.C.P.L.原创 2020-12-05 15:28:28 · 1595 阅读 · 2 评论 -
RDKit | 从ChEMBL数据库提取大分子HELM单体(XML转换为DataFrame并搜索部分结构)
研究大分子的HELM表示。HELM具有分层结构,并结合了单体来代表聚合物(例如肽)。HELM的特征是其表达的可扩展性,还可以通过将原始单体添加到单体库中来表达不自然的结构。另一方面,由于HELM表达式使用缩写(ID),所以如果不共享单体库,则存在指定具有相同ID的不同单体的风险,因此了解单体库很重要。找出什么样的单体信息存储在ChEMBL中,这是HELM也处理的熟悉的数据库。具体旨在读取XML文件中提供的单体库,并将其转换为Pandas DataFrame。导入库import xm原创 2020-12-05 15:23:03 · 1639 阅读 · 1 评论 -
DeepChem | 基于图卷积预测分子的溶解度
如何使用DeepChem库将图卷积用于类似问题的回归分析。from deepchem.models.tensorgraph.layers import GraphPool, GraphGatherfrom deepchem.models.tensorgraph.layers import Dense, L2Loss, WeightedError, Stackfrom deepchem.models.tensorgraph.layers import Label, Weightsimport nu原创 2020-05-12 09:41:04 · 2287 阅读 · 0 评论 -
DGL-LifeSci:面向化学和生物领域的 GNN 算法库
基于深度图学习框架DGL环境准备PyTorch:深度学习框架 DGL:基于PyTorch的库,支持深度学习以处理图形 RDKit:用于构建分子图并从字符串表示形式绘制结构式 DGL-LifeSci:面向化学和生物领域的 GNN 算法库DGL安装 conda install -c dglteam dglDGL-LifeSci安装pip install dgllife...原创 2020-06-20 17:27:12 · 2956 阅读 · 1 评论 -
“RDKit | 化学信息学与AI”专栏介绍及专栏内容分类(持续更新......)
“RDKit | 化学信息学与AI”专栏介绍 介绍RDKit相关知识点和运用以及RDKit作为处理化学、生物、药学和材料学科中分子数据作为可输入机器学习和深度学习模型的重要工具应用。内容涵盖了基于RDKit的Python3的分子的读写、化合物的分子指纹和分子描述符计算、化合物的2D/2D比对、化合物相似性搜索、化合物骨架分析和亚结构搜索、RMSD计算与构象生成优化、分子相似图与聚...原创 2019-12-25 17:26:25 · 9025 阅读 · 3 评论 -
DeepChem | DeepChem的图卷积特征化器
DeepChem官网:https://deepchem.io/DeepChem旨在提供高质量的开源工具链,将药物开发、材料科学、量子化学和生物学方面的深度学习应用普及化。DeepChem提供了几种用于图卷积的特征提取方法。探索对其中一种图形卷积Featurizer所做的事情。运行环境CentOS 7 Python3.6 DeepChem2.2导入库import ...原创 2019-10-09 15:26:48 · 2680 阅读 · 4 评论 -
DGL & RDKit|基于GCN与基于3D描述符的分子溶解度预测模型对比
GCNGCN : 图卷积神经网络(Graph Convolutional Networks)图卷积的原理处理图形或网络的数据形式存在许多重要的实际问题,如社交网络、知识图形、蛋白质相互作用网络和分子图形等。然而,将深度学习应用于这些图形数据是非常重要的,因为它具有独特地图特征。人们非常关注神经网络模型对这种结构化图形数据的概括。过去的几年中,许多论文重新讨论推广神经网络以处理任意结构化...原创 2020-01-16 13:58:04 · 2973 阅读 · 3 评论 -
基于DeepChem的溶解度预测(图形卷积,神经网络)
DeepChem是一个机器学习库,用于对化合物的图结构进行卷积。环境Python 3.6 DeepChem 1.1.0 TensorFlow 1.0.1 RDKit 2020.03.2基于DeepChem图卷积预测溶解度导入库import tensorflow as tfimport deepchem as dcimport numpy as np载入数据graph_featurizer = dc.feat.graph_features.ConvMolFeaturiz原创 2020-05-12 16:13:43 · 2699 阅读 · 1 评论 -
HTMD | 从PDB文件获取3D特征描述符
If reader is interested in drug discovery, chemoinformatics, deep learning or MD, I think the reader might read the article below.http://pubs.acs.org/doi/abs/10.1021/acs.jcim.7b00650KDEEP is predicto...原创 2020-05-11 17:09:09 · 2076 阅读 · 0 评论 -
Chemistry.AI | 基于图卷积神经网络(GCN)预测分子性质
GCN: Graph Convolutional Network(图卷积网络)环境准备Python版本:Python 3.6.8 PyTorch版本:PyTorch1.1.0 RDKit版本:RDKit 2020.03.1基于图卷积神经网络(GCN)预测分子性质from rdkit import Chemfrom rdkit.Chem.Crippen imp...原创 2020-04-27 14:46:02 · 7173 阅读 · 15 评论 -
Chemistry.AI | 基于循环神经网络(RNN)预测分子性质
Chemistry.AI | 基于卷积神经网络(CNN)预测分子特性环境准备Python版本:Python 3.6.8 PyTorch版本:PyTorch1.1.0 RDKit版本:RDKit 2020.03.1基于循环神经网络(RNN)预测分子性质导入库from rdkit import Chemfrom rdkit.Chem.Crippen import MolLog...原创 2020-04-26 11:45:11 · 2452 阅读 · 0 评论 -
Chemistry.AI | 基于卷积神经网络(CNN)预测分子特性
CNN :Convolutional Neural Networks(卷积神经网络)原创 2020-04-26 11:23:41 · 2636 阅读 · 12 评论 -
Chemistry.AI | 基于非线性激活的多层感知器预测分子特性
基于非线性激活的多层感知器预测分子特性原创 2020-04-03 08:39:39 · 1360 阅读 · 0 评论 -
Chemistry.AI | 基于线性回归预测分子特性
基于线性回归预测分子特性原创 2020-04-02 16:40:22 · 1535 阅读 · 0 评论