本书初版主要讲解序列决策问题中的核心理论和算法,基于该主题与不动点(fixed point)理论的强大联系。分析的重点是作为动态规划基础的抽象映射,并定义了相关问题的数学特征。本书涉及的讨论集在这个映射可能具有的两个基本性质上:单调性和(加权超范数)收缩性。事实证明,分析和算法动态规划理论的性质主要由这两个属性的存在与否决定,问题结构的其余部分在很大程度上是无关紧要的。
免费获取:强化学习新书-《抽象动态规划第二版》免费pdf分享
本书的第二版的主要目的是扩大第三章和第四章的半导体(semi-contractive)模型的介绍,并补充自第一版编写以来在期刊和报告中获得和发表的广泛研究成果。结果,本书的内容量增加了一倍多,页书也增加了大约40%。
本书目录
本书内容截图