Chemoinformatics
文章平均质量分 87
化学信息学
DrugAI
Fight Disease With Code ! Fight Disease With Data Technology !
药学、医学、化学和生物与计算机和AI交叉的爱好者从业者。
展开
-
RDChiral | 用于处理立体化学的RDKit封装器
RDChiral用于处理立体化学的RDKit封装器,用于反向合成模板提取和应用。人们对计算机辅助合成设计重新产生了兴趣,其中绝大多数方法都需要应用逆合成反应模板。RDChiral是一个开源的Python包装器,用于在应用以SMARTS字符串编码的逆合成转化时提供一致的立体化学信息处理。RDChiral的设计是为了执行手性四面体中心的引入、破坏、保留和反转,以及双键的顺/反构型。RDChiral的GitHub链接https://github.com/connorcoley/rdchiral原创 2021-01-10 18:51:46 · 1967 阅读 · 0 评论 -
CentOS 7.8下安装完美安装配置Rosetta
yum install boost-devel libstdc++ zlib zlib-devel bzip2https://zhuanlan.zhihu.com/p/58384830原创 2020-06-16 16:46:33 · 3337 阅读 · 4 评论 -
OpenEye | Windows下安装配置OpenEye
OpenEye简介 OpenEye是一款用于药物先导发现和改造的专业工具,它不仅考虑了严格的科学意义、还兼顾计算速度、可拓展性以及平台可用性。OpenEye药物设计软件聚焦于先导物识别与优化,尤其擅长分子对接(包含三种对接算法)、基于静电和形状相似性的虚拟筛选(速度非常快)、基于片段的药物设计、预测水分子对蛋白-配体结合作用影响和预测药物构象自由能等。 OpenE...原创 2020-04-13 13:00:42 · 5491 阅读 · 2 评论 -
开源化学信息学库 :ScaffoldGraph
ScaffoldGraph是一个开放源代码化学信息库,使用RDKit和NetworkX构建,用于生成和分析骨架网络和支架树。1特点 骨架网络生成(Varin, 2011)通过迭代删除可...原创 2020-04-07 00:13:00 · 2061 阅读 · 0 评论 -
PubChemPy | 化合物数据库PubChem与Python结合
化学数据库类型最著名的数据库是由美国化学学会管理的CAS,但是根据化合物的性质和用途,还有许多其他数据库。类型 说明 CAS 由美国化学学(ACS)会经营,非常庞大。 PubChem 美国国立卫生研究院(NIH)下面NCBI运营的数据库 ChemSpider 英国化学会拥有的化合物数据库 ZINC15 收集主要用于虚拟筛选的市售化合物数据库 ...原创 2020-01-06 15:27:06 · 7666 阅读 · 0 评论 -
“RDKit | 化学信息学与AI”专栏介绍及专栏内容分类(持续更新......)
“RDKit | 化学信息学与AI”专栏介绍 介绍RDKit相关知识点和运用以及RDKit作为处理化学、生物、药学和材料学科中分子数据作为可输入机器学习和深度学习模型的重要工具应用。内容涵盖了基于RDKit的Python3的分子的读写、化合物的分子指纹和分子描述符计算、化合物的2D/2D比对、化合物相似性搜索、化合物骨架分析和亚结构搜索、RMSD计算与构象生成优化、分子相似图与聚...原创 2019-12-25 17:26:25 · 8822 阅读 · 3 评论 -
Indigo | Indigo(Python)简介、安装与入门
Indigo简介Bingo: 针对Oracle,Microsoft SQL Server和PostgreSQL数据库的化学搜索引擎 Indigo: U具有与.NET,Java和Python绑定的通用化学信息库,以及以下工具: Legio: 组合化学GUI应用程序 ChemDiff: SDF或SMILES文件的可视化比较 indigo-depict: 分子和反应渲染工具 indigo-...原创 2020-02-19 19:44:04 · 3348 阅读 · 1 评论 -
Python:计算两个蛋白或小分子之间的RMSD
Python脚本:计算两个蛋白或小分子之间的RMSD用法:python rmsd.py protein1.pdb protein2.pdbrmsd.py# Root-mean-square deviation (RMSD) for proteins and/or ligands# in PDB files.#class Pdb(object): ""...原创 2018-07-11 23:42:04 · 15814 阅读 · 17 评论 -
Python:PDB文件中原子和残基重新编号
Python脚本:PDB文件中原子和残基重新编号Command:python renumber_pdb.py -i protein.pdb -a -r > output.pdbrenumber_pdb.py# Python 3 script to atoms and residues in a PDB file.## run# ./renumb...原创 2018-07-11 23:56:03 · 7329 阅读 · 4 评论 -
Python脚本:将mol2分子库文件拆分为单个mol2文件
如题:将mol2分子库文件拆分为单个mol2文件用法:python split_multimol2.py multi-mol2.mol2 out_dir注释:python 脚本文件 mol2分子库 输出目录split_multimol2.py:#Python2 or Python3#AspirinCode 2018#Script that splits a multi-...原创 2018-07-12 11:19:11 · 3978 阅读 · 2 评论 -
Chainer Chemistry | 用于化学和生物学的深度学习库
Chainer ChemistryChainer Chemistry是一个使用Chainer的化学和生物学深度学习库。Github地址:https://github.com/pfnet-research/chainer-chemistry 手册地址:https://chainer-chemistry.readthedocs.io该库可帮助您轻松地将深度学习应用于分子结构...原创 2019-11-27 10:28:39 · 2278 阅读 · 0 评论 -
GraphNVP | 用于分子图生成的可逆流模型
分子生成具有理想药理特性新分子的发现是计算药物发现中的关键问题。传统上,这项任务是通过临床合成候选化合物并对其进行实验来完成的。但是,由于化学空间是巨大的,合成分子并对其进行广泛的实验是非常耗时的任务。从头设计药物不是在分子中寻找具有所需特性的空间,而是设计具有我们感兴趣特性的新化合物。事实证明,深度学习的最新进展,尤其是深度生成模型在从头药物设计中具有不可估量的价值。分子表征将深...原创 2019-11-21 11:23:17 · 2189 阅读 · 0 评论 -
医疗领域中的AI/ML机会前景
简介尽管有数百个项目和数千位数据科学家致力于将AI / ML引入医疗保健领域,但采用率仍然很低且缓慢。1.药物研发 医疗领域的所有AI / ML机会中,这一机会实际上是最遥远的。 主要原因是由大型制药公司支付资金并由资本市场提供资金,而不是由付款人/医院/临床医生/患者财务链提供资金。但是,由于创新研究的风险以及新药的极高成本和漫长的批准时间,这些创新的回报可能在将...原创 2019-11-07 16:05:56 · 1311 阅读 · 0 评论 -
Pymol & BioPython | PDB文件中氨基酸序列的提取
1. Pymol当前目录下有一个PDB文件,利用pymol的命令模式:pymol receptor.pdb -c -d "save receptor.fasta"2.BioPythonfrom Bio import PDBparser = PDB.PDBParser()structure = parser.get_structure('2FH7', '2FH7.p...原创 2019-11-01 12:56:28 · 12347 阅读 · 0 评论 -
标准氨基酸和质子化氨基酸 三字母 单字母 对应表
|中文名称|英文名称|三字母符号|单字母符号|丙氨酸 Alanine A Ala苯丙氨酸 Phenylalanine F Phe半胱氨酸 Cysteine ...原创 2019-10-31 17:05:35 · 3322 阅读 · 0 评论 -
Rosetta | Rosetta简介
RosettaRosetta概览Rosetta软件包括用于蛋白质结构的计算建模和分析的算法。它使计算生物学取得了显着的科学进步,包括从头进行蛋白质设计,酶设计,分子对接以及生物大分子和大分子复合物的结构预测。所有非商业用户均可免费使用Rosetta,商业用户可付费使用Rosetta。Rosetta的开发始于华盛顿大学David Baker博士的实验室,作为结构预测工具,但从...原创 2019-11-08 15:05:24 · 11908 阅读 · 0 评论 -
PubChem的Python接口PubChemPy
PubChemPubChem,即有机小分子生物活性数据,是一种化学模组的数据库,由美国国家健康研究院( US National Institutes of Health,NIH)支持,美国国家生物技术信息中心负责维护。PubChem数据库包括 3个子数据库: PubChem BioAssay 库用于存储生化实验数据,实验数据主要来自高通量筛选实验和科技文献; PubChem Compoun...原创 2019-10-24 15:58:51 · 6573 阅读 · 4 评论 -
Python创建Excel表格并写入数据之xlwt
#!python3#coding:utf-8import xlwtf = xlwt.Workbook()sheet1 = f.add_sheet(r'sheet1', cell_overwrite_ok=True)sheet1.write(0,0,"Name")sheet1.write(0,1,"Conf")sheet1.write(0,2,"Grid score")sh...原创 2019-10-24 15:18:08 · 4361 阅读 · 0 评论 -
SMILES & InChI | 化学结构的线性表示法
SMILES表示法、SMARTS表示法和InChI表示法都是用少量字符表示结构信息的重要方法。化合物的图表示 可以将一个分子视为一个以原子为节点,结合为边的图。图形可以表示一个原子如何连接到另一个原子。如果已知原子之间的键数,则可以在以后添加氢原子,因此在计算机上表示分子时通常会省略氢原子。 例如,丙烷可以表示为...原创 2019-10-14 09:26:01 · 6393 阅读 · 1 评论 -
利用openbabel2.4.1进行小分子构象搜索
利用open babel产生小分子多重构象的方法有两种:一,使用遗传算法(遗传算法)进行构象搜索,属于系统式搜索最低能量构象的方法obabel -L conformer命令可以详细查看conformer插件的使用方法以下命令可以为小分子生成20个小分子构象,然后使用-writeconformers参数将所有的构象写成输出结构文件:obabel ligand.mol2 -O l...原创 2018-08-22 19:42:45 · 4564 阅读 · 0 评论 -
DrugBank:小分子数据信息挖掘
DrugBank数据库简介DrugBank数据库是唯一将详细的药品数据(即化学,药理学和制药)与综合药物靶点信息(即序列,结构和作用通路)相结合的“生物信息学和化学信息学”资源.DrugBank由加拿大卫生研究院,亚伯达省创新 - 健康解决方案和代谢组学创新中心(TMIC)提供支持,该中心是国家资助的研究以及支持广泛的尖端技术代谢组学研究的核心.DrugBank数据库查询包含以下信息:药品类型...原创 2018-08-21 18:59:13 · 20848 阅读 · 25 评论 -
化学结构格式SDF的认识
第一行:一般作为分子名字,如 Levetiracetam第二行:注释,ChemDraw06111413562D第三行:一般是空行第四行:是原子个数 键的个数等的起始行。M END所在行结束原子个数 键的个数等信息。属性1属性1值空行属性2属性2值空行(以四个美元符号结束一个分子的信息存储。)Levetiracetam ChemDraw0...原创 2018-09-04 15:19:34 · 13302 阅读 · 2 评论 -
氨基酸周期表
原创 2019-02-23 16:25:12 · 3386 阅读 · 0 评论 -
KEGG数据库
KEGG的简介KEGG是一个整合了基因组、化学和系统功能信息的数据库。把从已经完整测序的基因组中得到的基因目录与更高级别的细胞、物种和生态系统水平的系统功能关联起来是KEGG数据库的特色之一。与其他数据库相比,KEGG的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,这样可以使研究者能够对其关注的代谢途径有直观全面的了解。KEGG ...原创 2019-03-24 22:35:18 · 4487 阅读 · 0 评论 -
Python生物信息学②从PDB文件中提取蛋白序列
环境OS version : Win10 x64python_version : Python 3.6.5实例代码aa_codes = { 'ALA':'A', 'CYS':'C', 'ASP':'D', 'GLU':'E', 'PHE':'F', 'GLY':'G', 'HIS':'H', 'LYS':'K', 'ILE':'I', '...原创 2019-03-24 23:23:05 · 8303 阅读 · 0 评论 -
Nature | 机器学习在药物研发中的应用
摘要药物研发管线漫长、复杂且取决于许多因素。机器学习(ML)通过丰富且高质量的数据改进指定问题的发现和决策。机器学习在药物发现的所有阶段都有应用:靶标验证、生物标志物的鉴定和临床试验中数字病理学数据的分析。应用程序的范围和方法不同,有些方法可以产生准确的预测和解释。应用机器学习的主要挑战在于ML产生的结果缺乏可解释性和可重复性,可能限制其应用。在所有领域,仍然需要生成系统和全面的高维数据。...原创 2019-06-18 12:48:18 · 5850 阅读 · 1 评论 -
NGLView 安装与配置-交互式分子结构和轨迹查看
NGLViewNGLview 是Jupyter Notebook的小插件, 可用于交互地可视化分子结构, 可以查看分子动力学轨迹数据. 支持读取文件数据。程序的源代码可以在网上Github里查看, 同时也可以在PyPI和bioconda内获取. NGLview在服务器端采用python, 而在客户端则采用JS来实现, 与Jupyter的整合则通过ipywidgets包实现. 客户端采用N...原创 2019-10-16 18:29:50 · 4587 阅读 · 3 评论 -
力场与电荷
力场力场(Force Field, 常简写为FF)这个物理学名词听起来有点高深, 可如果理解了它的含义你就会觉得这是很自然的一个概念, 没有什么特别之处.在中学物理或者初等力学中, 研究物体的运动都是从分析其受力出发的, 可以说是以力为基础, 这也是称为力学的原因. 牛顿第二定律直接将物体的受力与其加速度联系起来, 这样只要知道了物体的受力情况, 就能计算出其运动轨迹. 在力学中, 一般将...原创 2019-09-27 22:18:09 · 2320 阅读 · 0 评论 -
化学结构信息与图论
分子图模型通常使用一种模型,在该模型中,化合物以原子为节点,键为边的图形表示,通常省略氢。节点存储信息(标签),例如原子类型、电荷、多重性和质量,而边存储键合顺序。每个都可以具有关于芳族和立体异构的信息。至于键序,最好以π电子而不是边缘的形式给出节点,以反映实际的原子轨道和三维结构。分子图通常表示为无边的无向图。具有边缘方向(存在单向路径)的图称为有向图。分子图通常是简单图。简单...原创 2019-09-29 16:10:12 · 4192 阅读 · 0 评论 -
SMILES | 简化分子线性输入规范
简化分子线性输入规范(SMILES,Simplified molecular-input line-entry system)是一种用ASCII字符串明确描述分子结构的规范,由David Weininger和Arthur Weininger于20世纪80年代晚期开发,并由其他人,尤其是日光化学信息系统有限公司修改和扩展。 SMILES字符串可以被大多数分子编辑软件...原创 2019-10-02 15:46:28 · 8892 阅读 · 0 评论 -
ChemDataExtractor:从PDF、HTM、文本等中提取化学数据
ChemDataExtractor简介ChemDataExtractor是一种从科学文档中自动提取化学信息的工具。给它一篇期刊文章,它将从文本中提取化学名称、属性和光谱,以便将它们导入数据库或电子表格。ChemDataExtractor官网ChemDataExtractor特点自然语言处理ChemDataExtractor使用最先进的自然语言处理算法来解释构成大多数科学文档的英...原创 2018-08-12 17:46:29 · 3642 阅读 · 0 评论