自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

秋曾万的博客

一些关于强化学习/统计学习/算法的文章

  • 博客(1)
  • 资源 (2)
  • 收藏
  • 关注

原创 A Distribution Perspective on Reinforcement Learning(C51) 概率分布下的贝尔曼方程

原本的Bellman Equation 更新为 ////// 状态值函数Q(x,a)Q(x,a)Q(x,a)是一个单点值函数,表示x状态下执行a动作的累计回报(期望) 去掉期望后,得到的就是一个关于随机变量的函数关系: ////// 这里的随机变量Z(x,a)Z(x,a)Z(x,a) 是在x状态下执行a动作之后的回报形成的随机变量。注意它是具有概率...

2018-12-26 09:50:07 3421

李宏毅GAN对抗生成网络2018最新ppt全套

李宏毅GAN对抗生成网络2018最新ppt全套,内容非常详细,结合视频一起学习,将大有裨益

2018-08-17

最优化方法ppt(中科院大学研究生课程)

国科大的最优化方法ppt,内容非常全,说明也很详细,无论是从事机器学习方向还是本事就是做优化的看,都会有收获

2018-08-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除