- 博客(2)
- 收藏
- 关注
原创 DataWhale AI夏令营-催化反应速率预测(task2 笔记)
定义RNN模型__init__方法num_embed:词汇表的大小,即嵌入层的词汇表大小。input_size:嵌入维度,即每个词的表示维度。:RNN隐藏层的维度。:RNN的输出层大小。num_layers:RNN的层数。dropout:dropout的概率,用于防止过拟合。device:用于指定计算设备(如GPU)将化学反应数据(以 SMILES 字符串形式表示)处理成可以输入到机器学习模型中的格式。处理流程包括分词、填充、索引化以及数据加载。## 数据处理部分。
2024-07-31 21:32:07
301
原创 Datawhale AI 夏令营 (催化反应率预测)笔记
所以,可以使用rdkit工具直接提取SMILES的分子指纹(向量),作为特征。是一个非常广泛使用的开源机器学习库,基于Python,建立在NumPy、SciPy、Pandas和Matplotlib等数据处理和分析的库之上。读取数据,将化学分子的SMILES字符串转换为Morgan指纹,并将这些指纹拼接成特征向量,用于后续的机器学习建模。它通过结合多个决策树的预测来提高模型的准确性和稳定性。Morgan指纹是一种常用的分子指纹类型,能够编码分子结构的特征。生成分子的Morgan指纹。生成submit结果。
2024-07-28 22:26:02
754
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人