Smiles2vec
简而言之,它是自然语言处理(NLP)领域的一项技术,可将字符串转换为矢量。 许多人用smiles字符串预测物理属性。
Smiles2vec的结构
将字符串转换为矢量是NLP领域的一项技术名为Seq2Seq。 在没有学习的情况下简单地解释它,它经常被用在“机器对话和机器翻译等模型”中。 该技术基于递归神经网络的思想使用诸如LSTM和GRU的层。 下图显示了原始论文中Smiles2vec的结构。 在本文中隐藏层的根据化合物结构和物理性质而改变。
导入库
from __future__ import print_function
import keras
from sklearn.utils import shuffle
from keras.models import Sequential, Model
from keras.la