自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 RDKit|使用MolDraw2DCairo模块绘制分子

文章目录一、绘制png:MolDraw2DCairo二、绘制svg:MolDraw2DSVG三、绘制png设置(svg设置类似)一、绘制png:MolDraw2DCairo先导入所要用到的库和MolDraw2DCairo模块。from rdkit import Chemfrom rdkit.Chem.Draw import rdMolDraw2Dfrom IPython.display import Image首先,创建一个Cairo drawer:Chem.Draw.rdMolDraw2D

2020-07-17 23:07:44 2081

原创 案例研究|它凭借AI刷新了药物先导物设计的最快记录!

文章目录一、案例简介二、团队背景三、靶点与抑制剂四、分子设计过程五、专利分析一、案例简介Insilico Medicine公司使用AI技术,在短短46天内设计并筛选出了一个DDR1受体抑制剂,这个化合物在小鼠体内具有较好的药代动力学性质,有望继续改造并用于治疗纤维化相关的疾病。该结果于2019年9月2日发表在nature biotechnology上。Nature biotechnology杂志最新影响因子IF为31.864分。尽管近几年IF有所下滑,但是仍然在生物技术领域的杂志中稳居前3,年刊文量也

2020-06-21 23:30:37 805

原创 RDKit|在PostgreSQL中进行分子相似性搜索

文章目录一、分子指纹计算二、相似性搜索三、自定义搜索函数一、分子指纹计算本文介绍在windows环境下,使用rdkit函数在postgresql数据库中进行相似性搜索。环境搭建、数据表准备不再赘述,可以参考这篇文章。在上述工作基础上,继续进行指纹计算、建立索引。操作之前先看看在postgresql中支持的指纹函数:layered_fp(mol):另一种rdkit原创指纹,官方文档的解释是它一种子结构指纹,与rdkit拓扑子图的生成步骤一致,但根据子图生成指纹向量的过程有所不同。在子结构指纹类别中,l

2020-05-30 22:53:43 832

原创 RDKit|在PostgreSQL中进行分子结构搜索与查询

文章目录一、环境搭建二、数据表准备三、结构搜索与查询1.smiles子结构搜索2.smarts子结构搜索3.立体信息的结构搜索4.带取代基的结构搜索一、环境搭建本文以windows为例进行操作和演示。假设都已经安装好了postgresql,下面依次进行用户切换、启动服务端、创建数据库、导入数据、连接数据库、加载插件、函数测试。在windows上安装带rdkit插件的postgresql以及基本操作可以参考这篇文章。在cmd中切换到postgres用户runas /user:postgres cm

2020-05-30 16:26:56 751

原创 RDKit|支持RDKit的PostgreSQL环境搭建与基本操作

文章目录一、环境配置1.windows下的安装与初始化2.用户设置与服务启动二、操作使用1.cmd操作2.python操作一、环境配置PostgreSQL是一个开源、可扩展的关系型数据库,rdkit官网文档里也是以postgresql作为案例进行演示。本文介绍带rdkit插件的postgresql在windows系统上的环境配置,以及在python环境下的基本操作。1.windows下的安装与初始化直接在cmd下使用conda安装C:\Users\Administrator> conda

2020-05-27 11:23:36 1124 2

原创 RDKit|分子修改与编辑

文章目录一、初级篇1.氢原子显示与隐藏2.芳香键与kekule式转换二、高级篇1.Atom和Bond对象的编辑功能2.RWMol类的编辑功能一、初级篇1.氢原子显示与隐藏正常情况下,分子在rdkit中存储时,氢以隐式氢的形式存储,即不会在图片中显示出来。当需要加入氢原子时,例如要生成和优化立体结构,可以通过函数加上氢原子。加氢:AddHs()去氢:RemoveHs()>>> from rdkit import Chem>>> m = Chem.MolFr

2020-05-24 15:35:53 4265 1

原创 RDKit|分子基础操作与药效团查找

文章目录分子基础操作与药效团查找1.原子操作2.键操作3.环操作4.手动实现氧族药效团查找分子基础操作与药效团查找1.原子操作在rdkit中,分子中的每一个原子都是对象,可以通过原子对象的属性和函数来获取各种信息。对原子进行遍历:m.GetAtoms()获取原子索引:GetIdx()获取原子序号:GetAtomicNum()获取原子符号:GetSymbol()获取原子连接数(受H是否隐藏影响):GetDegree()获取原子总连接数(与H是否隐藏无关):GetTotalDegree()

2020-05-23 21:46:25 4077

原创 RDKit|通过Recap和BRICS对分子拆解与合成

文章目录Recap和BRICS对分子拆解与合成1.Recap拆解2.BRICS拆解3.BRICS合成Recap和BRICS对分子拆解与合成1.Recap拆解另一个与化学反应相关的功能是Recap,Recap可以模仿实验室中的正向合成过程来进行逆向操作,对分子进行一系列的转换与分解,最终得到一组合理的分子片段。Recap可以对拆解过程进行追踪,并形成类似树的数据结构。原始分子记为根节点(root),被拆解的分子记为父节点(parent),拆解得到的分子记为子节点(children),某节点下的所有分支节

2020-05-22 23:18:44 2266

原创 RDKit|在化学反应中对原子进行保护

文章目录在化学反应中保护原子1.rxn文件创建反应2.保护目标原子在化学反应中保护原子本文是化学反应的进阶操作,关于使用rdkit进行化学反应的操作可以参考这篇文章。有时在使用rxn文件时,很难准确表达或全面考虑到每个细节,导致不需要的原子发生反应,并产生副产物。而rdkit也提供了保护原子的操作,避免不需要的原子参与到反应中。还是以形成酰胺键为例。1.rxn文件创建反应通过rxn文件创建一个反应模式:ReactionFromRxnFile()检查一下该反应:ReactionToImage()

2020-05-22 17:40:05 393

原创 RDKit|化学反应操作与处理

文章目录化学反应1.SMARTS创建反应2.rxn文件创建反应3.产物后处理化学反应Rdkit中提供了基于SMARTS的化学反应操作,可以通过SMARTS或rxn反应文件构建反应模式,再对指定的反应物进行匹配,将匹配上的结构按反应模式进行合成。1.SMARTS创建反应从SMARTS创建一个反应模式:Chem.ReactionFromSmarts()下面这个反应表示一个羧基,与至少带有一个氢的氮原子反应,形成酰胺定义反应物:reactants进行一个反应:RunReactants(reacta

2020-05-22 00:24:58 2522 4

原创 RDKit|骨架分解与侧链分离

文章目录一、骨架分解1.Murcko Scaffold2.Generic Framework二、侧链分离1.rdRGroupDecomposition2.ReplaceCore一、骨架分解1.Murcko ScaffoldMurcko骨架由Murcko等人设计并用药物的形状、结构分析。他们将药物分子拆解成四种单元:环系结构(ring system)、接头(linker)、骨架(scaffold)、侧链(side chain),其中scaffold又由ring system和linker组成;scaff

2020-05-21 15:04:17 1909

原创 RDKit|分子片段、片段指纹与指纹重要性分析

文章目录一、分子片段生成二、片段指纹生成三、指纹重要性分析一、分子片段生成分子片段(Molecular Fragments)是一组相连的原子,并可能包含有相关官能团。在rdkit中提供了一系列用于分析、操作分子片段的工具。说起来比较抽象,操作起来也比较抽象。获取官能团库:RDConfig.RDDataDir目录下的’FunctionalGroups.txt’根据官能团库实例化一个参数器:FragmentCatalog.FragCatParams()>>> import os

2020-05-20 18:59:51 1620 3

原创 RDKit|化学特征、药效团提取与2D药效团指纹计算

文章目录一、化学特征和药效团提取二、化学特征文件介绍1.化学特征(chemical features)2.FDef文件语法三、2D药效团指纹1.编码原理2.参数设置3.生成2D药效团指纹4.修改FDef设置5.Gobbi 2D药效团指纹一、化学特征和药效团提取Rdkit中有一系列基于SMARTS定义的化学特征。要对分子进行化学特征分析和计算时,需要先导入一个特征库,创建一个特征工厂,并通过特征工厂计算化学特征。先来操作一下,原理及介绍在第二部分。获取特征库:RDConfig.RDDataDir目录下

2020-05-19 00:34:38 2331 1

原创 RDKit|分子描述符计算与可视化

文章目录一、描述符计算模块1.rdkit.Chem.Lipinski模块2.rdkit.Chem.Descriptors模块3.rdkit.ML.Descriptors.MoleculeDescriptors模块二、原子描述符可视化1.原子partial charge可视化2.原子logP可视化一、描述符计算模块1.rdkit.Chem.Lipinski模块rdkit中提供了许多描述符的计算方法,可用于分子筛选、成药性评估等。以lipinski类药的相关规则为例,可以通过rdkit.Chem.Lipi

2020-05-16 19:10:53 8401 4

原创 RDKit|分子指纹提取、相似性比较及应用

文章目录一、分子指纹提取1.Topological Fingerprints2.MACCS3.Atom Pairs and Topological Torsions4.Morgan Fingerprints (Circular Fingerprints)二、相似性比较一、分子指纹提取1.Topological Fingerprints也叫RDKit topological fingerprint。该算法受Daylight fingerprint启发而产生,它会计算所有介于minPath和maxPath

2020-05-15 22:48:22 12639 1

原创 RDKit|最大公共子结构搜索与参数介绍

文章目录最大公共子结构1.搜索方法2.bondCompare参数3.atomCompare参数4.maximizeBonds参数5.matchValences参数6.ringMatchesRingOnly参数7.completeRingsOnly参数8.timeout参数最大公共子结构rdkit中提供了在多个分子间查找最大公共子结构(Maximum Common Substructure, MCS)的功能。该功能可以应用在相同骨架搜索、分子库分析、寻找药效团等场景中。1.搜索方法FindMCS(m

2020-05-13 00:38:15 2397 1

原创 RDKit|摩根分子指纹计算、提取与可视化

文章目录一、摩根分子指纹计算1.简介2.SparseIntVects3.ExplicitBitVects4.FCFPs5.更多泛化二、摩根分子指纹提取1.提取方法一2.提取方法二三、指纹可视化一、摩根分子指纹计算1.简介摩根分子指纹(Morgan Fingerprints),是一种圆形指纹,也属于拓扑型指纹,是通过对标准的摩根算法进行改造后得到。可以大致等同于扩展连通性指纹(Extended...

2020-05-07 17:27:43 14363 2

原创 RDKit|分子子结构的删除、替换与切割

文章目录分子子结构操作1.删除子结构2.替换子结构3.切掉侧链4.切掉母核分子子结构操作RDKit包含了一些修改分子的函数,这些函数可以方便地对分子进行子结构删除/替换等操作。更复杂的操作可以看Chemical Reactions中相关的功能。1.删除子结构先初始化一下定义一个苯丙氨酸分子,要把苯甲基删掉,变成甘氨酸>>> from rdkit import Ch...

2020-04-28 23:00:27 4420

原创 化学信息学|SMARTS规则速查表

文章目录一、SMARTS简介二、原子属性三、键属性四、逻辑操作符五、递归SMARTS六、组合匹配七、反应SMARTS一、SMARTS简介是什么SMARTS(SMiles ARbitrary Target Specification)是一种用于描述分子模式和属性的语言。SMILES所有的符号和属性在SMARTS中同样适用,因此它也是SMILES的延伸。此外,SMARTS还包括了逻辑操作符和...

2020-04-24 21:17:32 8712

原创 RDKit|搜索子结构时对侧链进行条件限制

文章目录一、简单子结构搜索1. 初始化2. 获取所有匹配的结构3. 查看匹配的结构二、带条件的子结构搜索1. 定义条件2. 对侧链设置条件3. 使用条件进行筛选4. 其他条件举例一、简单子结构搜索1. 初始化m表示待搜索的原始分子p表示带侧链的四元环结构>>> from rdkit import Chem>>> from rdkit.Chem i...

2020-04-24 00:11:05 581

原创 RDKit|搜索并高亮展示分子中匹配的子结构

文章目录一、单个子结构搜索与展示1.判断是否包含子结构2.搜索并返回子结构3.获取匹配的原子和索引4.绘制子结构二、多个子结构搜索与展示1.搜索并返回所有子结构2.获取匹配的原子和索引3.设置原子和键的颜色4.绘制多个子结构一、单个子结构搜索与展示首先初始化一个分子,并设置一个要搜索的SMARTS/SMILES>>> from rdkit import Chem>&...

2020-04-22 00:11:19 3248

原创 RDKit|分子3D构象生成与优化

文章目录一、简介二、构象生成算法三、四、一、简介让计算机识别分子结构是计算化学码农的必备技能,也是对分子进行后续操作的基础。本文整理和总结了rdkit进行读取、输出和可视化的一些方法,包含对SMILES、SDF、MOL、MOL2、CSV等文件的处理,以及分子的结构展示。二、构象生成算法先来了解两种rdkit生成3D构象的方法:距离几何法距离几何法步骤:1.通过分子的连接表信息和一套规...

2020-04-19 17:57:47 8566 3

原创 RDKit|一站式搞定分子读取、输出、可视化

读取分子:读SMILES、读DataFrame、读取sdf、mol、mol2...输出分子:输出SMILES、输出sdf、mol、pdb...可视化:单独可视化、批量可视化、3D可视化...

2020-04-18 23:46:30 18431 12

原创 扩展连通性指纹(Extended Connectivity Fingerprints,ECFPs)原理介绍

文章目录一、简介二、应用三、特性四、与路径指纹的对比五、表示方法1.整数标识列(list of integer identifiers)2.定长比特串(fixed-length bit string)六、生成流程1.初始化原子标识符2.标识符的迭代更新3.标识符去重七、参数设置1.主要参数2.原子属性八、功能基指纹九、特征可视化十、rdkit计算ECFPs一、简介本文参考自ChemAxon的介...

2020-04-17 23:27:41 7822

原创 机器学习|决策树算法与python实现

目录:1.决策树简介2.决策树生成a) 选择标准——熵b) 信息增益——ID3算法c) 信息增益率——C4.5算法d) Gini系数——CART算法e) 评价标准——评价函数3.剪枝操作a) 预剪枝b) 后剪枝4.决策树的集成——随机森林5.Sklearn构造决策树a) 数据包介绍b) 5行代码构造决策树c) 参数简介1.决策树简介

2017-06-15 13:15:11 854

原创 机器学习|最小二乘法的概率解释

用概率的思维推导出最小二乘法

2017-06-10 14:39:10 1603 1

原创 机器学习|环境搭建、入门基础等

决胜AI系列课程学习笔记(一)python环境搭建、机器学习一般步骤、使用到的库、回归算法原理等内容。

2017-06-07 09:25:27 646

原创 机器学习|回归问题与python实现

大多数的回归问题,都可以使用最小二乘法来求解参数,而求解参数的过程又通常依赖梯度下降法。不仅是回归问题,很多机器学习都是基于梯度下降来实现参数优化,因此梯度下降可以说是机器学习的核心算法之一。简单地说梯度下降利用导数,通过不断迭代,经过有限次的运算,逐渐逼近最优解。1. 一元回归与最小二乘直接看吴恩达老师课程中的例子。现在有一些房价和面积的数据(x,y),想找出他们之间的关系。我们可以大概画

2017-06-05 17:48:35 1208 1

原创 OOP编程|我拿你当朋友,你却把我当爸爸

1.我拿你当朋友,你拿我当爸爸5月10日,在法国大选第二轮投票中,马克龙战胜了极右翼政党的勒庞,并在14日就职,成为最年轻的法国总统。39岁的政坛小鲜肉火了,一同火起来的,还有他的妻子布丽吉特,以及他们饱受争议的爱情。曾经,布丽吉特是马克龙的中学老师。而布丽吉特的大女儿劳伦斯,又和马克龙是同班同学。所以,当时他们的关系是这样的:之前的关系图最终,有情人终成眷属。马克龙成为了布丽吉特的丈夫,所

2017-06-05 17:48:29 1181

原创 像Excel一样使用Python(二)

像excel一样使用python,上一期介绍了生成、查看、替换等功能,这一期介绍数据预处理,包括数据表合并、排序、分组等。1.合并Excel里智能复制粘贴来合并表格,或者通过VLOOKUP函数分步实现。python中,可以直接使用merge函数来合并两个表,可选参数较多,这里只介绍最常用的几个参数:df1.merge(df2,how='inner',on=None,left_on=None,rig

2017-06-05 17:48:26 3983

原创 像Excel一样使用Python(一)

一、基本介绍在进行数据处理时,如果数据简单,数量不多,excel是大家的首选。但是当数据众多,类型复杂,需要灵活地显示切片、进行索引、以及排序时,python会更加方便。借助python中的numpy和pandas库,它能快速完成各种任务,包括数据的创建、检查、清洗、预处理、提取、筛选、汇总、统计等。接下来几篇文章,将以excel为参照,介绍python中数据的处理。提到pandas,那就不得不

2017-06-05 17:48:23 3326 1

原创 OOP编程|加班加得好,劳务少不了

五一你加班了么?1.加班费计算五一节快乐!有多少还在五一节加班的?晒晒你们的加班费是多少?以小编为例,小编写了两篇1000字和2500字的稿件,经过计算之后,稿费为300和450¥。计算代码如下:classpay_cal(object):def__init__(self, num):self.cal = numdefpay(self):self.pay =200+self.cal /10print

2017-06-05 17:48:20 305

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除