python
文章平均质量分 88
秋曾万
这个作者很懒,什么都没留下…
展开
-
python的语言风格(一)
python的语言风格(一)从本文开始,笔者将介绍一些python的语言风格,利用这些方式去编写代码、组织逻辑将事半功倍。有兴趣的朋友可以阅读Guido van Rossum的文章www.Python.org/dev/peps/pep-0020/模块结构和布局:用模块结构来合理组织你的Python代码是简单又自然的方法。你应该建立一种统一且容易阅读的结构,并将它应用到每一个文件中去。下原创 2018-01-26 20:57:01 · 826 阅读 · 0 评论 -
A Distribution Perspective on Reinforcement Learning(C51) 概率分布下的贝尔曼方程
原本的Bellman Equation 更新为 ////// 状态值函数Q(x,a)Q(x,a)Q(x,a)是一个单点值函数,表示x状态下执行a动作的累计回报(期望)去掉期望后,得到的就是一个关于随机变量的函数关系://////这里的随机变量Z(x,a)Z(x,a)Z(x,a) 是在x状态下执行a动作之后的回报形成的随机变量。注意它是具有概率...原创 2018-12-26 09:50:07 · 3476 阅读 · 0 评论