深度强化学习
dywvv
这个作者很懒,什么都没留下…
展开
-
Multi-Head Self-Attention
在示例的最后部分,我们创建一个多头自注意力层并将其应用于输入张量。原创 2023-04-14 13:20:01 · 412 阅读 · 1 评论 -
Categorical类
类是PyTorch中的一个类,用于处理离散分类概率分布。它可以处理概率分布(probs)或者logits(对数概率)。# 假设我们有一个离散概率分布,有3个类别,概率分别为[0.1, 0.5, 0.4]类提供了一些实用方法,如生成随机样本、计算概率或对数概率等。# 使用概率创建Categorical对象。# 从分布中采样一个随机动作。# 计算给定动作的对数概率。# 计算给定动作的概率。原创 2023-04-10 11:47:10 · 1264 阅读 · 1 评论