Pytorch中的强化学习

torch.distributions.Categorical()

功能:根据概率分布来产生sample,产生的sample是输入tensor的index
如:
  >>> m = Categorical(torch.tensor([ 0.25, 0.25, 0.25, 0.25 ]))
  >>> m.sample()   # equal probability of 0, 1, 2, 3
  tensor(3)
 

转载于:https://www.cnblogs.com/sbj123456789/p/9692711.html

发布了0 篇原创文章 · 获赞 3 · 访问量 4万+
展开阅读全文
评论将由博主筛选后显示,对所有人可见 | 还能输入1000个字符

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 编程工作室 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览