注意力机制实例中Q、K区分

  • 当你用上淘宝购物时,你会敲入一句关键词(比如:显瘦),这个就是Query。
  • 搜索系统会根据关键词这个去查找一系列相关的Key(商品名称、图片)。 最后系统会将相应的 Value (具体的衣服)返回给你。

  • 在中译英模型中,中文句子通过编码器被转化为一组特征表示K,这些特征表示包含了输入中文句子的语义信息。
  • 解码器在生成英文句子时,会使用这些特征表示K以及当前生成的英文单词特征Q来决定下一个英文单词是什么。
    (在Encoder-Decoder模型中,K是Encoder中的元素,而Q是Decoder中的元素。)
  • 注意力机制中的 Q 和 K:

    Q (Query): 是当前要查询的内容,通常代表“我想知道什么”。

    K (Key): 是可以被查询的信息,通常代表“我提供了什么信息”。

  • 淘宝搜索的类比:

    Q (Query): 你输入的关键词,比如“显瘦”。这代表了你正在“寻找”某些信息。

    K (Key): 淘宝中商品的描述或名称。每个商品都有一组关键词(Key),系统会根据这些 Key 来查找最匹配的内容

  • 中译英模型中的 Q 和 K:

    K (Key): 在中译英模型中,K 是由编码器生成的中文句子的特征表示。这些特征表示了中文句子的信息,编码器生成的这些特征是“可以被查询”的。

    Q (Query): Q 是由解码器的当前状态或已经生成的英文单词的特征表示。这代表了解码器当前的“查询”,即解码器在生成下一个英文单词时,“寻找”什么样的输入信息来帮助决定下一个词。

  • 结合两个场景理解

    在淘宝搜索的例子中,你的 Q(关键词“显瘦”)是主动查询的内容,K(商品的描述或名称)是系统用来匹配查询的内容。

    在中译英模型中,Q 是解码器当前的状态,它使用 Q 来查询 K,也就是中文句子的特征表示,从中获取有用的信息(V)来帮助生成下一个英文单词。

  • 核心理解:
    Q 是主动发起查询的一方,K 是被查询的一方。淘宝的例子中,你是主动查询的,所以你提供了 Q。在中译英模型中,解码器是主动查询的,所以解码器的状态是 Q,而中文的特征是 K。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值