深度强化学习
文章平均质量分 95
fighting233
我就是我,颜色不一样的花火
展开
-
机器学习、深度学习、强化学习
深度学习无约束优化问题的优化方法有哪些? 1、直接法 2、迭代法 2.1 一阶法(梯度下降法)2.2 二阶法(牛顿法)L1正则化使得模型参数具有稀疏性(0比较多)的原理是什么?强化学习1、强化学习和监督学习以及非监督学习的区别监督学习是使用已经标记好的数据样本,做训练来预测新的数据的类型(分类)或者值(回归)...原创 2021-07-09 16:01:00 · 3536 阅读 · 0 评论 -
torch.distributions.categorical(probs)
class torch.distributions.categorical(probs)其作用是创建以参数probs为标准的类别分布,样本是来自“0,...,K-1”的整数,K是probs参数的长度。也就是说,按照probs的概率,在相应的位置进行采样,采样返回的是该位置的整数索引。如果probs是长度为K的一维列表,则每个元素是对该索引处的类进行采样的相对概率。如果probs是二维的,它被视为一批概率向量例如:probs = torch.FloatTensor([0.9,0.2])原创 2020-05-23 13:27:47 · 14247 阅读 · 6 评论