《人工智能：一种现代的方法》总结第二章

最新推荐文章于 2022-06-23 23:00:08 发布

来自BUAA的小孩

最新推荐文章于 2022-06-23 23:00:08 发布

阅读量1.9k

点赞数

分类专栏：《人工智能：一种现代的方法》总结文章标签：人工智能智能Agent

本文链接：https://blog.csdn.net/AchildFromBUAA/article/details/67064377

版权

《人工智能：一种现代的方法》总结专栏收录该内容

0 篇文章 0 订阅

订阅专栏

第二章智能Agent

这一章主要讨论了Agent的各个方面，给读者一个初步的了解。

Agent是什么？Agent，在我看来，是一个在环境中，可以感知周围环境，并根据环境而进行动作的一个object。当然，我们需要的是一个理性的Agent。而理性的Agent做出的动作，应该是让它的性能度量最大化的动作，也就是说，该动作是一个正向性的动作。

当然，不同的价值观对于正向的标准是不同的，所以一个智能Agent需要根据所了解的知识来做出相应的行为。但是它又不能仅仅是根据其设计人员的价值观来判断事物，这样的话它就缺乏了自主性。我们需要的理性Agent应该能通过自身的学习来弥补之前的所了解的不足和缺陷。就如同刚出生的婴儿一般，理性Agent刚开始的时候可能会存在诸多随机的行为来处理事务，但是根据经验的积累，就逐渐形成了一套此Agent认为的价值观。

由于智能Agent依赖与环境，所以我们需要知道环境的性质。PEAS（性能，环境，执行器，传感器）是我们设计Agent的时候需要首先详细说明清楚的任务环境。它存在着很多维度：观察性，传感器是否可以完全记录Agent周围环境的状态；Agent数量，需要多少Agent
来完成特定的任务；随机性，环境中下一个状态是否完全取决于Agent
根据当前环境执行的动作；延续性，Agent的下一个片段是否依赖于之前片段中采取的行动；动态性，环境是否会变化；连续性，变化是否连续；未知性，Agent知识库中是否知道次问题的解决办法。

Agent其自身也存在着结构。Agent是一个体系结构和程序的组合，程序一定要适应体系结构。本书继续介绍了四种基本的Agent程序：简单反射Agent，它仅仅根据当前的环境感知来选择动作，它虽然很简洁，它的智能却是很有限的，并且很多情况现会陷入无限循环当中，随机化是解决这个问题的一个很好的办法；基于模型反射的Agent，根据感知历史来维持内部状态，并且根据已有的知识反应出当前状态无法看到的信息，再来选择动作；基于目标的Agent，根据当前状态以及目标信息来确定动作，也就是说它和之前两种不同的是，它考虑了动作的结果，当然，因此它的效率就会相对低，但是它可以使过程变得相对更灵活；基于效用的Agent，它在之前三种的基础上增加了对于行动结果的效益判断，它可以使期望效用最大化，但是对于这点需要深一步的研究。

学习Agent，由评判元件、学习元件、性能元件、问题产生器构成。学习元件通过评判元件的反馈来让Agent知道如何能做的更好，并确定如何修改负责动作的性能元件，问题产生器就是提供实验行动的元件。