![](https://img-blog.csdnimg.cn/20190927151124774.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
基础-随机过程
文章平均质量分 92
基础-随机过程
nopSled
一周一更
展开
-
CATEGORICAL REPARAMETERIZATION WITH GUMBEL-SOFTMAX翻译
摘要分类变量是代表世界离散结构的自然选择。然而,随机神经网络很少使用分类潜在变量,因为无法通过样本来反向传播梯度。在这项工作中,我们提出了一种有效的梯度估计器,通过使用一种基于Gumbel-Softmax分布的可微分采样,该估计器替代了分类分布中的不可微分采样。该分布具有必要的属性,可以将其顺利退火到分类分布中。我们表明,我们的Gumbel-Softmax估计器在具有分类潜在变量的结构化输出预测和无监督的生成模型任务中到达可最先进的梯度估计,并在半监督分类实现了加速。1.介绍具有离散随机变量的随机神经翻译 2021-10-20 16:51:57 · 548 阅读 · 0 评论 -
What My Deep Model Doesn't Know...翻译
前言翻译 2020-03-20 11:14:15 · 271 阅读 · 0 评论 -
Pólya urn model翻译
在统计学中,以乔治·波利亚命名的Pólya瓮模型(也称为Pólya瓮方案或简称为Pólya瓮)是一种统计模型,用作理想化的心理锻炼(mental exercise)框架,统一了许多治疗方法。 步骤:在瓮模型中,物体(例如原子,人,汽车等)在瓮或其他容器中被表示为彩色的球。在基本的Pólya瓮模型中,容器中包含xxx个白色和yyy个黑色球;从容器中随机抽取一个球并观察其颜色; 然后将其放回到容器...翻译 2018-09-24 15:16:40 · 1291 阅读 · 1 评论 -
狄利克雷过程翻译及代码实现
在概率论中,狄利克雷过程(在Peter Gustav Lejeune Dirichlet之后)是以概率分布作为其实现的随机过程。 换句话说,狄利克雷过程是概率分布的集合。 它经常用于贝叶斯推理中用来描述关于随机变量分布的先验知识——随机变量有多大可能服从一个或某个特定的概率分布。 狄利克雷过程由基本分布HHH和正实数αα\alpha指定,其中αα\alpha称为浓度参数(也称为缩放参数)...翻译 2018-09-09 16:15:35 · 4027 阅读 · 0 评论 -
中餐馆过程算法翻译及代码实现
中餐馆过程算法 在概率论中,中国餐馆过程是一个时间离散的(discrete-time)随机过程(stochastic process),类似于中国餐馆中坐在餐桌旁的顾客。想象一个这样的情景,一家中国餐厅拥有无限数量的圆形桌子,每个桌子都有无限的容量。此时,顾客1坐在第一张桌子旁。下一个顾客要么坐在与顾客1相同的桌子旁,要么坐在下一张桌子旁。这样的情况会一直持续下去,每个顾客要么选择坐在已有其...翻译 2018-09-02 15:04:05 · 3709 阅读 · 1 评论