- 博客(1)
- 收藏
- 关注
原创 【Datawhale AI 夏令营2024】Transformer建模SMILES进行反应产率预测
官方给出的数据就是规范化后的。其中 $$Q \in R^{L\times d_{q}$$, $$K \in R^{L\times d_{k}$$, $$V \in R^{L\times d_{v}$$分别表示输入序列中的不同单词的 $$q,k,$$向量拼接组成的矩阵,L 表示序列长度, $$Z \in R^{L\times d_{v}$$表示自注意力操作的输出。其中,$$po$$ 表示单词所在的位置,$$2$$ 和 $$2i+$$ 表示位置编码向量中的对应维度,$$$$则对应位置编码的总维度。
2024-08-03 18:42:22 1030
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人