目录
查询向量(Query)、键向量(Key)和值向量(Value)的作用
Encoder-Decoder注意力层箭头解释:1:K;2:V;3:Q
查询向量(Query)、键向量(Key)和值向量(Value)的作用
在Transformer架构中,查询向量(Query)、键向量(Key)和值向量(Value)是注意力机制的核心组成部分。它们的作用如下:
- 查询向量(Query):用于衡量与每个键向量(Key)的相关性。在注意力机制中,查询向量通常与当前需要处理的位置(如解码阶段的当前位置)或整个序列(编码阶段)的信息相对应。它起到了寻找与当前处理位置相关信息的作用。

订阅专栏 解锁全文
771

被折叠的 条评论
为什么被折叠?



