- 博客(0)
- 资源 (16)
- 收藏
- 关注
DiCE: The Infinitely Differentiable Monte Carlo Estimator
The score function estimator is widely used for
estimating gradients of stochastic objectives in
Stochastic Computation Graphs (SCG), e.g., in
reinforcement learning and meta-learning. While
deriving the first order gradient estimators by differentiating
a surrogate loss (SL) objective is computationally
and conceptually simple, using the
same approach for higher order gradients is more
challenging.
2018-02-17
卡尔曼滤波算法(含详细推导).ppt
卡尔曼滤波算法(含详细推导).ppt
考虑一离散时间的动态系统,它由描述状态向量的过程方程和描述观测向量的观测方程共同表示。
(1)、过程方程
式中,M 1向量x(n)表示系统在离散时间n的状态向量,它是不可观测的;M M矩阵F(n+1,n)成为状态转移矩阵,描述动态系统在时间n的状态到n+1的状态之间的转移,应为已知。而M 1向量 为过程噪声向量,它描述状态转移中间的加性噪声或误差。
2018-02-12
hadoop-core-1.1.2.jar修改版
本包是为了解决在windows下通过cygwin运行hadoop时,执行tasktracker模块时报错Failed to set permissions of path: \mapred\local\ttprivate to 0700,通过修改源代码来解决的包。希望能该问题困扰的童鞋们,提供便利。
注意:仅为了在windows下学习hadoop使用,不建议应用到生产环境。
2013-07-20
ActionScript 3.0 概要.doc
ActionScript 3.0 概要.doc
Actionscript 3.0 演变成一门强大的面向对象的编程语言意味着flash平台的重大变革。这种变化也意味着 Actionscript 3.0 将创造性地将语言理想地迅速地建立出适应网络的丰富应用程序, 成为丰富网络应用(Rich Internet Application)项目的本质部分。比较早期的Actionscript版本就已经提供了这种要求为创造真实地参与在线体验的力量和灵活性。Actionscript 3.0 将促进和发展这种性能, 提供发展强大表现和舒适的先进的高度复杂应用, 结合大型数据库以及可移值性的面象对象的代码。拥有 Actionscript 3.0, 开发者可能达到高效执行效率和表现同一的平 台。
2012-02-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人