nlp&python | 使用bert提取分子表征(ongoing)

本文探讨了如何借鉴BERT在NLP领域的成功经验,将其应用于化学表示学习,特别是SMILES序列。介绍了三个自监督学习任务:Masked Language Modeling、SMILES Equivalence和Physical Chemistry Property Prediction,并阐述了损失函数的计算方法。最后,展示了获取的分子特征向量示例。
摘要由CSDN通过智能技术生成

介绍

BERT在自然语言处理(NLP)领域取得了巨大的成功。使用未经标记的数据集进行训练,可以得到能学会复杂的语言表示形式的大规模模型。那么,我们可以将类似的研究方法应用于化学表示中,尤其是SMILES序列:
在这里插入图片描述

自监督学习任务

在这里插入图片描述
1.Masked language modeling(MASKEDLM)
BERT提出的规范任务,通过训练模型来预测mask的真实身份。使用序列输出和输入的mask之间的交叉熵损失来优化任务。

2.SMILES equivalence (SMILES-EQ)
给定第一个smiles,第二个smiles从

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ASKCOS

你的鼓励是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值