- 博客(26)
- 资源 (7)
- 收藏
- 关注
原创 RDKit | 基于SMILES查找化合物的MACCS密钥
导入包from rdkit import Chemfrom rdkit.Chem import MACCSkeysfrom rdkit import DataStructsimport numpy as np载入smiles并计算MACCS Keysmol = Chem.MolFromSmiles('OC(=O)C1=C(C=CC=C1)C2=C3C=CC(=O)C(=C3O...
2019-09-29 16:27:16 3932 1
原创 化学结构信息与图论
分子图模型通常使用一种模型,在该模型中,化合物以原子为节点,键为边的图形表示,通常省略氢。节点存储信息(标签),例如原子类型、电荷、多重性和质量,而边存储键合顺序。每个都可以具有关于芳族和立体异构的信息。至于键序,最好以π电子而不是边缘的形式给出节点,以反映实际的原子轨道和三维结构。分子图通常表示为无边的无向图。具有边缘方向(存在单向路径)的图称为有向图。分子图通常是简单图。简单...
2019-09-29 16:10:12 4811
原创 RDKit | 比较化合物并通过PCA可视化化学空间
化学空间与指纹 化学空间是一个虚拟空间,放置了世界上所有可能存在的化合物。从概念上讲,取决于原子的连接方式,可以存在无限数量的化合物,因此可以说化合物空间具有巨大的尺寸。 实际工作中,有必要将化合物空间放到数学空间中。具体地说,必须根据某些规则将每个化合物转换为固定长度的向量。该向量称为指纹,并且已经提出了用于生成指纹的各种方法。本文案例实际上使用了称为MACC...
2019-09-29 15:21:48 2086 3
原创 RDKit | 计算化合物描述符
描述符Descriptor:通过量化部分结构特征和物理化学性质来表达化合物的化学特征。导入库import rdkitimport pandas as pdfrom rdkit import Chemfrom rdkit.Chem import Descriptorsfrom rdkit.ML.Descriptors import MoleculeDescriptors载入...
2019-09-29 12:33:03 5272 5
原创 SQL基本语法和书写格式
插入insert [into] 表名 [(列名列表)] values (值列表)insert into 新表名 (列名列表) select 列名列表 from 表名select 表名.列名 into 新表名 from 表名insert 表名(列名列表) select 值列表1 union select 值列表2修改update 表名 set 列名 = 更新值 [whe...
2019-09-27 22:23:50 1429
原创 力场与电荷
力场力场(Force Field, 常简写为FF)这个物理学名词听起来有点高深, 可如果理解了它的含义你就会觉得这是很自然的一个概念, 没有什么特别之处.在中学物理或者初等力学中, 研究物体的运动都是从分析其受力出发的, 可以说是以力为基础, 这也是称为力学的原因. 牛顿第二定律直接将物体的受力与其加速度联系起来, 这样只要知道了物体的受力情况, 就能计算出其运动轨迹. 在力学中, 一般将...
2019-09-27 22:18:09 2424
原创 RDKit | 基于Ward方法对化合物进行分层聚类
从许多化合物构建结构多样的化合物库:聚类方法 基于距离的方法 基于分类的方法 使用优化方法的方法通过使用Ward方法进行聚类从化合物库中选择“各种”化合物,Ward方法是分层聚类方法之一。导入库from rdkit import rdBase, Chem, DataStructsfrom rdkit.Chem import AllChemfrom rdkit.Chem.D...
2019-09-22 12:41:49 3649 11
原创 RDKit | 定量评估类药性(QED)
QED(quantitative estimate of drug-likeness)是一种将药物相似性量化为介于0和1之间的数值的方法。药物相似性 如Lippinsky规则所示,获批药物的理化参数表明,这些化合物分布在狭窄的范围内。进入该化学空间的化合物称为“类药物(drug-like)”。 类药性不是化学结构的特征,而是由几个物理参数组合确定的指标。已经提...
2019-09-21 17:37:11 7118
原创 RDKit | 删除方差低的描述符
背景基于由RDKit和mordred等描述符计算生成的特征进行化合物的机器学习时,由于特征数量大且存在过拟合的可能,因此有必要进行特征选择。尝试了scikit-learn的VarianceTheshold,一种基本的特征选择算法。什么是方差阈值可删除不满足给定方差的样本特征。默认情况下,将删除0方差,即所有样本具有相同值的要素。作为另一个示例,描述了一个示例,其中相对于布尔值0和...
2019-09-21 13:15:51 1639
原创 Smiles2vec | 用于预测化学性质的深度神经网络
作者丨王建民单位丨超级计算长沙中心,湖南大学研究方向丨药物设计、生物医药大数据Smiles2vec简而言之,它是自然语言处理(NLP)领域的一项技术,可将字符串转换为向量。许多人用SMI...
2019-09-18 00:03:45 4057
原创 RDKit | 化合物库的相似性分析
展示一种小分子数据库的相似性分析策略。实例中使用SMILES文件,该分析可以以相同的方式从分子的SDF或其他格式文件中加载数据,只需确保使用适当的方法将分子加载到RDKit中。导入库import osimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom m...
2019-09-17 10:28:06 2872
原创 基于Smiles2vec预测化合物物理性质
Smiles2vec简而言之,它是自然语言处理(NLP)领域的一项技术,可将字符串转换为矢量。 许多人用smiles字符串预测物理属性。Smiles2vec的结构将字符串转换为矢量是NLP领域的一项技术名为Seq2Seq。 在没有学习的情况下简单地解释它,它经常被用在“机器对话和机器翻译等模型”中。 该技术基于递归神经网络的思想使用诸如LSTM和GRU的层。 下图显示了原始论文中...
2019-09-16 10:55:00 3338 3
原创 RDKit | 分子坐标的测量和绘图
导入库from rdkit import Chemfrom rdkit.Chem import AllChemfrom rdkit.Chem.Draw import IPythonConsolefrom rdkit.Chem import PyMolimport picklemolH = pickle.load(open('molH_confs.pkl','rb'))...
2019-09-14 19:12:36 2849 3
原创 RDKit | 分子的多种构象
导入库from rdkit import Chemfrom rdkit.Chem import AllChemfrom rdkit.Chem.Draw import IPythonConsolefrom rdkit.Chem.Draw.MolDrawing import MolDrawing, DrawingOptionsimport picklefrom rdkit.Chem...
2019-09-14 19:00:07 2145
原创 RDKit | 分子的力场优化
导入库from rdkit import Chemfrom rdkit.Chem import AllChemfrom rdkit.Chem.Draw import IPythonConsolefrom rdkit.Chem.Draw.MolDrawing import MolDrawing, DrawingOptionsimport pickle载入数据molH = ...
2019-09-14 13:22:58 1929
原创 RDKit | 分子处理入门
导入库from rdkit import Chemfrom rdkit.Chem import AllChemfrom rdkit.Chem.Draw import IPythonConsole from rdkit.Chem.Draw.MolDrawing import MolDrawing, DrawingOptions 修改分子默认显示DrawingOpti...
2019-09-13 18:51:07 4410 4
原创 Bioinformatics|癌症细胞系的用药反应预测
作者 | 陈家民指导 | 曾湘祥教授单位 | 湖南大学研究方向 | 精准医学,图神经网络1. 研究背景预测癌症患者对癌症药物的反应是精准医疗的重要问题。由于花大量的时间与金钱完成大批量癌...
2019-09-13 14:23:08 1618
原创 RDKit | 可视化重要片段
1. 导入依赖库from matplotlib.pyplot import figure, imshow, axisfrom rdkit import Chemfrom rdkit.Chem import AllChemfrom rdkit import DataStructsimport numpy as npfrom sklearn.metrics import mean...
2019-09-13 13:48:59 1452
原创 JMC | 基于机器学习精确预测激酶抑制剂结合模式
作者丨王建民单位丨超级计算长沙中心,湖南大学研究方向丨药物设计、生物医药大数据本期介绍2019年8月发表在Journal of Medicinal Chemistry的研究工作,研究人...
2019-09-12 00:01:34 1789
原创 RDKit | 比较分子之间的相似性
比较分子之间的相似性获取结构和数据,将SMILES转换为RDKit分子对象,然后比较相似性。1.导入python模块import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib as ...
2019-09-11 23:11:05 5402 8
原创 RDKit | 基于PCA探索化学空间
基于主成分分析和聚类探索化学空间PCA :Principal Component Analysis分析化合物数据库,发现它们之间的共享描述符(物理化学特性)。1. 导入库import osimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltfro...
2019-09-11 11:01:41 2044
原创 蛋白序列 | 基于深度学习的蛋白质序列家族分类
背景简介蛋白质数据集来自于结构生物信息学研究协作组织(RCSB)的蛋白质数据库(PDB)。RCSB : Research Collaboratory for Structural BioinformaticsPDB : Protein Data BankPDB是原子坐标和描述蛋白质和其他重要生物大分子的信息储存库。结构生物学家使用诸如X射线晶体学、NMR和低温电子显微术的方法来...
2019-09-10 11:29:22 6360 8
原创 EPIVAN | 基于预训练和注意力机制的启动子增强子相互作用预测
作者 | 洪曾艳指导 | 刘向荣教授单位 | 厦门大学研究方向 | 生物序列分析1. 研究背景增强子是一段50-1500bp的DNA序列,它能够提高特定基因的转录活性,能大大增强启动子的...
2019-09-09 20:11:45 1995
原创 GraphDTA | 基于图卷积网络预测药物-靶标结合亲和力
作者 | 马腾飞指导 | 曾湘祥教授审稿 | 王建民单位 | 湖南大学研究方向 | 药物发现、生物医药大数据1. 研究背景现有的高通量筛选实验用于确定药物和靶标之间的生物活性是一个昂贵费...
2019-09-07 07:00:00 9898
原创 nature | 基于深度学习方法的虚拟组织染色
作者 | 罗潇澧指导 | 曾湘祥教授单位 | 湖南大学研究方向 | 生物医学检测研究背景组织病理学可以追溯到19世纪,它一直是病理学中使用的黄金标准诊断方法之一。如果在医学检查之后或在外...
2019-09-05 16:22:21 3556
原创 Nat. Commun | 基于网络的药物组合预测
作者丨王建民单位丨超级计算长沙中心,湖南大学研究方向丨药物设计、生物医药大数据本期介绍2019年3月发表在Nature Communications的研究工作,该工作由哈佛医学院、东北大...
2019-09-01 21:52:50 3195
RDKit Documentation Release 2019.09.1.pdf
2019-12-26
基于神经网络的溶解度预测和回归分析的数据集文件
2018-09-16
pymol-2.1.0-cp36-cp36m-win
2018-05-18
2017-Bioinformatics-Volume II- Structure, Function, and Applications
2018-05-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人