人工智能原理第八章课后习题答案（仅供参考）

最新推荐文章于 2024-10-15 01:20:33 发布

xcy2014117129

最新推荐文章于 2024-10-15 01:20:33 发布

阅读量286

点赞数

分类专栏：人工智能习题答案文章标签：人工智能

本文链接：https://blog.csdn.net/xcy2014117129/article/details/137386284

版权

人工智能习题答案专栏收录该内容

14 篇文章 3 订阅 ¥15.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了决策理论规划与时空关联规划的区别，强调在不确定性下的规划和风险管理。此外，介绍了马尔科夫性质及其在天气模型中的应用，并详细阐述了马尔科夫决策过程（MDP）的要素，包括状态、动作、转换函数、奖惩函数和折扣因子，以及优化控制涉及的动态规划和强化学习方法。

摘要由CSDN通过智能技术生成

8.1 论述决策理论规划与上一章时空关联规划的区别
时空关联规则基于如下假设条件：
1 确定性：动作具有确定的效果，在某个状态中使用的每个状态都会带来一个新的状态。
2 完全可观测性：具有系统当前状态的完整知识，观测结果为系统的单一状态，即当前状态
3 可达性目标：目标是一组状态，其目的是建立可达到一个目标状态的计划
决策理论规划是在上述假设之外的情况下如何进行规划的问题。决策理论规划基于决策理论，特别是在考虑不确定性和风险评估时。它侧重于选择最佳行动方案，以最大化或最小化某个预期效用函数。
在现实生活中，决策理论规划的应用非常广泛，例如高端的机器人控制，医药治疗、灾害救援等。因为人们必须考虑这样的事实，即不同的行动可能有不同的结果。其中一些动作可能比其它动作更有利，因此需要对实现目标状态的潜力、产生不良状态的风险、以及执行规划的成本做出决策。
决策理论根植于概率论和效用理论，用于在给定的任何状态下求得某个行动可能结果的概率分布、以及结果的合理性偏好函数。可以定义结果的效用函数，使得智能主体偏好的某个规划具有更高的预期效用。智能主体的任务很简单，就是找到最大期望效用。

8.2 随机过程由一组随机变量组成。反之给定一组随机变量，它是否就是随机过程，为什么？
一个随机过程通常被定义为一组随机变量的集合，即：{S(0),S(1),…,S(t)},其