使用self.param方法和posemb_init函数初始化位置

Waltt_Qiope

于 2024-04-12 01:36:46 发布

阅读量150

点赞数 2

文章标签： python 人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Waltt_Qiope/article/details/137659385

版权

class AddPositionEmbs(nn.Module):
  """Adds learned positional embeddings to the inputs.

  Attributes:
    posemb_init: positional embedding initializer.
  """

  posemb_init: Callable[[PRNGKey, Shape, Dtype], Array]
  #PRNGKey：一个用于生成随机数的伪随机数生成器的密钥。
  #Shape：一个元组，表示要初始化的位置嵌入的形状。
  #Dtype：位置嵌入的数据类型。
  #你是在声明posemb_init是一个类型为Callable[[PRNGKey, Shape, Dtype], Array]的变量。
  #这意味着posemb_init应该是一个可调用对象（比如函数），它接受三个参数（一个PRNGKey、一个Shape和一个Dtype），并返回一个Array。
  param_dtype: Dtype = jnp.float32
  #这段代码为 param_dtype 定义了一个默认值 jnp.float32，它将被用作参数的数据类型（dtype）。

  @nn.compact
  def __call__(self, inputs):
    """Applies the AddPositionEmbs module.

    Args:
      inputs: Inputs to the layer.

    Returns:
      Output tensor with shape `(bs, timesteps, in_dim)`.
      bs 表示批量大小（batch size），timesteps 表示时间步（或序列长度），in_dim 表示输入维度。
    """
    # inputs.shape is (batch_size, seq_len, emb_dim).
    #bz:表示每个批次（batch）中图像的数量。
    #seq_len:seq_len 表示了输入序列的长度，即图像被划分成了多少个序列元素(patch)。
    #emb_dim:图片展开的维度，例如16*16*3
    pos_emb_shape = (1, inputs.shape[1], inputs.shape[2])
    #pos_emb_shape这个形状通常用于初始化位置嵌入的张量，以确保位置嵌入与输入张量的维度相匹配。
    pe = self.param(
        'pos_embedding', self.posemb_init, pos_emb_shape, self.param_dtype)
    return inputs + pe

博客等级

码龄2年

27
原创

129
点赞

126
收藏

110
粉丝

关注

私信

热门文章

最新评论

使用self.param方法和posemb_init函数初始化位置
CSDN-Ada助手: 恭喜您写了第19篇博客！看到您介绍了使用self.param方法和posemb_init函数初始化位置的方法，让我受益匪浅。希望您能继续坚持创作，分享更多有价值的内容给读者。或许下一步可以探讨一些高级技巧或者实战经验，让我们更深入地了解这个领域。期待您的下一篇作品！愿您越来越好！
拷贝构造函数和拷贝赋值函数
CSDN-Ada助手: 恭喜您发布了关于拷贝构造函数和拷贝赋值函数的博客，内容讲解详细，让读者受益匪浅。希望您能继续坚持创作，为大家分享更多有价值的知识。下一步建议可以探讨一些高级的C++特性或者实际项目中的应用案例，相信会更加吸引读者。期待您的更多精彩内容！
关于引用特殊情况的编译
CSDN-Ada助手: 恭喜你写了第18篇博客！看来你对编译和引用特殊情况有着深入的研究和理解。希望你能继续保持创作的热情，不断分享你的见解和经验。或许下一步可以考虑写一些实例分析，或者分享一些实用的技巧和工具，以帮助更多读者解决实际问题。期待你更多精彩的文章！加油！🌟
一道有关类和new的奇怪的理论题
CSDN-Ada助手: 恭喜您写了第16篇博客！看到标题我就被吸引了，这个题目听起来真的很有趣。希望您可以继续分享这样的奇思妙想，让我们一起探讨类和new的奇妙之处。如果可能的话，也可以考虑分享一些实例或案例，让读者更容易理解您的观点。期待您的下一篇作品！
python自学
CSDN-Ada助手: 恭喜用户第13篇博客“python自学”发布成功！持续创作是提升自己的最好方法，希望您能坚持下去，不断挑战自己。下一步建议可以尝试写一些项目实践的经验分享，或者深入探讨python的一些高级特性，相信会给读者带来更多收获。希望我的建议能对您有所帮助，期待您更多精彩的作品！

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。