基于Smiles2vec预测化合物物理性质

最新推荐文章于 2024-08-03 17:23:30 发布

DrugAI

最新推荐文章于 2024-08-03 17:23:30 发布

阅读量3.3k

点赞数 1

分类专栏： RDKit | 化学信息学与AI 文章标签： RDKit 化学信息学深度学习 Python

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/u012325865/article/details/100879193

版权

RDKit | 化学信息学与AI 专栏收录该内容

154 篇文章 640 订阅 ¥99.00 ¥99.00

订阅专栏

超级会员免费看

本文介绍了Smiles2vec技术，这是一种将化学中的Smiles字符串转化为向量的方法，常用于预测物质的物理属性。Smiles2vec基于NLP的Seq2Seq模型，结合LSTM或GRU层，其结构可以根据化合物结构和物理性质调整。文章还提到了相关的数据处理和模型定义步骤。

摘要由CSDN通过智能技术生成

Smiles2vec

简而言之，它是自然语言处理（NLP）领域的一项技术，可将字符串转换为矢量。许多人用smiles字符串预测物理属性。

Smiles2vec的结构

将字符串转换为矢量是NLP领域的一项技术名为Seq2Seq。在没有学习的情况下简单地解释它，它经常被用在“机器对话和机器翻译等模型”中。该技术基于递归神经网络的思想使用诸如LSTM和GRU的层。下图显示了原始论文中Smiles2vec的结构。在本文中隐藏层的根据化合物结构和物理性质而改变。

导入库

from __future__ import print_function
import keras
from sklearn.utils import shuffle
from keras.models import Sequential, Model
from keras.la

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

DrugAI

关注关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

订阅专栏

Smiles2vec | 用于预测化学性质的深度神经网络

DrugAI

09-18

4057

作者丨王建民单位丨超级计算长沙中心，湖南大学研究方向丨药物设计、生物医药大数据Smiles2vec简而言之，它是自然语言处理（NLP）领域的一项技术，可将字符串转换为向量。许多人用SMI...

RDKit | 基于SMILES查找化合物的MACCS密钥

DrugAI

09-29

3937

导入包 from rdkit import Chem from rdkit.Chem import MACCSkeys from rdkit import DataStructs import numpy as np 载入smiles并计算MACCS Keys mol = Chem.MolFromSmiles('OC(=O)C1=C(C=CC=C1)C2=C3C=CC(=O)C(=C3O...

3 条评论您还未登录，请先登录后发表或查看评论

基于机器学习的高能化合物分子设计与性质预测.pdf

09-02

【高水平】基于机器学习的高能化合物分子设计与性质预测-天津大学硕士论文2020，超过130页

Transformer建模SMILES进行反应产率预测 #Datawhale AI 夏令营 8.3

最新发布

m0_73915369的博客

08-03

242

循环神经网络：由于所有的前文信息都蕴含在一个隐向量里面，这会导致随着序列长度的增加，编码在隐藏状态中的序列早期的上下文信息被逐渐遗忘。卷积神经网络：受限的上下文窗口在建模长文本方面天然地存在不足。如果需要关注长文本，就需要多层的卷积操作。1.嵌入层 (embedding layer)将token转化为向量表示。模型认识的只是向量，所以需要将每个切分好的token转化为向量。

基于smiles的神经网络预测分子性质

m0_57734104的博客

09-16

2909

涉及到的数据集

ACM-BCB2019 | SMILES-BERT：基于大规模无监督预训练的分子属性预测模型

justBeHerHero

11-23

2252

ACM-BCB2019 | SMILES-BERT：基于大规模无监督预训练的分子属性预测模型原文标题：SMILES-BERT: Large Scale Unsupervised Pre-Training for Molecular Property Prediction

AI医药论文解读--SmileGNN：基于SMILES和GNN的药物相互作用预测

xiao_muyu的博客

12-07

4589

SmileGNN：基于SMILES和GNN的药物相互作用预测论文题目 SmileGNN: Drug-Drug Interaction Prediction Based on SMILES and Graph Neural Network 论文出自 Research Article（Preprints）,June 10th, 2021 论文链接：SmileGNN 文章目录SmileGNN：基于SMILES和GNN的药物相互作用预测一、SmileGNN模型？二、各模块详细介绍？三、实验？四

基于smiles的神经网络预测分子性质.

09-14

展示通过神经网络用分子的特性来预测分子性质，主要内容就是介绍神经网络的原理，以及搭建神经网络的步骤和关于smiles分子式的处理。

DeepChem | 基于DeepChem的GCN预测化合物溶解度

DrugAI

01-05

2285

导入库 from __future__ import print_function from __future__ import division from __future__ import unicode_literals from rdkit import Chem from rdkit.Chem.Draw import IPythonConsole from rdkit.Chem import Draw import deepchem as dc import numpy as np...

smiles2vec

09-02

此外，Smiles2Vec还可以用于分子属性的预测，比如溶解度、药效等。总而言之，Smiles2Vec是一种将SMILES字符串转化为向量表示的方法，可以用于处理和分析化学分子的结构信息。它的应用领域覆盖了分子相似性比较、...

SMILES2020:包含SMILES所有资料的存储库，Skoltech的夏季机器学习学校，将于8月16日至21日举行

03-09

SMILES2020:包含SMILES所有资料的存储库，Skoltech的夏季机器学习学校，将于8月16日至21日举行

SMILES：化学结构的线性表示方法

jasminefeng的博客

10-28

6322

SMILES：化学结构的线性表示方法

DGraphDTA训练部分源码解读分析（二）2021SC@SDUSC

chy931088287的博客

12-28

1399

2021SC@SDUSC 加载亲和力值数据 affinity = pickle.load(open(dataset_path + 'Y', 'rb'), encoding='latin1') 设置四个list分别存储药物SMILES、蛋白质序列、蛋白质key、药物分子式，并使用数据集通过循环将它们填满 drugs = [] prots = [] prot_keys = [] drug_smiles = [] # smiles for d in ligands.keys(): lg = Chem.

SMILES, a Chemical Language and Information System.【SMILES, 一种化学语言和信息系统。】

weixin_45928096的博客

04-28

2775

SMILES, a Chemical Language and Information System. SMILES（Simplified Molecular Input Line Entry System 简化分子输入行输入系统）是为现代化学信息处理而设计的化学符号系统。基于分子图论的原理，SMILES允许通过使用非常小且自然的语法进行严格的结构说明。SMILES符号系统也非常适合高速机器处理。由此产生的化学家易用性和机器兼容性允许设计许多高效的化学计算机应用程序，包括生成独特的符号、恒定速度（零阶）数据

“RDKit | 化学信息学与AI”专栏介绍及专栏内容分类（持续更新......）

DrugAI

12-25

9036

“RDKit | 化学信息学与AI”专栏介绍介绍RDKit相关知识点和运用以及RDKit作为处理化学、生物、药学和材料学科中分子数据作为可输入机器学习和深度学习模型的重要工具应用。内容涵盖了基于RDKit的Python3的分子的读写、化合物的分子指纹和分子描述符计算、化合物的2D/2D比对、化合物相似性搜索、化合物骨架分析和亚结构搜索、RMSD计算与构象生成优化、分子相似图与聚...

python机器学习-乳腺癌细胞挖掘

09-16

作者介绍 Toby，持牌照金融公司担任模型验证专家,国内最大医药数据中心数据挖掘部门负责人！和重庆儿科医院，中科院教授，赛柏蓝保持慢病数据挖掘项目合作！管理过欧美日中印巴西等国外药典数据库，马丁代尔数据库，FDA溶解度数据库，临床试验数据库，WHO药物预警等数据库。课程概述此课程讲述如何运用python的sklearn快速建立机器学习模型。课程结合美国威斯康辛乳腺癌细胞临床数据，实操演练，建立癌细胞预测分类器。课程讲述十大经典机器学习算法：逻辑回归，支持向量，KNN,神经网络，随机森林，xgboost,lightGBM,catboost。这些算法模型可以应用于各个领域数据。本视频系列通俗易懂，课程针对学生和科研机构，python爱好者。本视频教程系列有完整python代码，观众看后可以下载实际操作。了解癌症肿瘤基本常识，建立健康生活方式，预防癌症，减轻癌症治疗成本。课程背景警钟长鸣！癌症离我们远吗？《我不是药神》催人泪下，笔者在此揭露真相，癌症不是小概率疾病，癌症就在身边。癌症早期发现和控制可极大延长寿命和减少治疗费用。笔者下载美国威斯康辛临床数据，运用python sklearn建立乳腺癌分类器模型，可预测正常细胞和癌细胞。我国医院重视治疗，但忽略疾病预防教育。通过我多年机器学习数据挖掘，我发现疾病可防可控，通过自身努力，我们可以提前发现疾病早期症状或扼杀疾病于摇篮。希望此课程让广大医疗科研工作者认识疾病预防教育重要性。

SMILES | 简化分子线性输入规范

DrugAI

10-02

9053

简化分子线性输入规范（SMILES，Simplified molecular-input line-entry system）是一种用ASCII字符串明确描述分子结构的规范，由David Weininger和Arthur Weininger于20世纪80年代晚期开发，并由其他人，尤其是日光化学信息系统有限公司修改和扩展。 SMILES字符串可以被大多数分子编辑软件...

蛋白质FASTA与药物分子SMILES数据集文本数据处理与可视化分析（一）2021SC@SDUSC

chy931088287的博客

12-15

1559

本文基于davis数据集进行操作2021SC@SDUSC 首先最直接的方式是学习一下别人的项目中是如何处理数据的在项目代码中，指定了一个ParamList的字典用键值对的方式存储配置信息下图为所选的数据集ESOL_SMILESValue.txt的结构，每一行数据逗号左侧为分子SMILES序列，右侧为该分子对应的label 下一步就是把刚刚的ParamList（此次已封装到opt里），将opt作为参数送入MolDatasetCreator构造方法中创建一个对应的对象，后续会使用此对象进行进一步处理，接下