人工智能：现代方法阅读笔记2

何草不玄丶

已于 2023-01-24 01:22:54 修改

阅读量189

点赞数

文章标签：人工智能 Powered by 金山文档

于 2023-01-22 02:51:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_47637467/article/details/128748035

版权

第二章智能体

智能体和环境

定义：任何通过传感器（sensor）感知环境（environment）并通过执行器（actuator）作用于该环境的事物都可以被视为智能体（agent）。

智能体的行为由智能体函数描述，该函数将任意给定的感知序列映射到一个动作，但这个函数理论上是无限的，作为其实现，实际上是智能体程序，其可以在物理系统中运行。

理性的概念

理性智能体：做正确事情的事物

（1）性能度量（什么是良好行为）

由于需要确保“施以机器的目的是我们真正想要的目的”，因此，结果论常常是针对人工智能的性能度量方法。

（2）理性

理性取决于以下4方面：定义成功标准的性能度量；智能体对环境的先验知识；智能体可以执行的动作；智能体到目前为止的感知序列。

因此，理性智能体的定义是：对于每个可能的感知序列，给定感知序列提供的证据和智能体所拥有的任何先验知识，理性智能体应该选择一个期望最大化其性能度量的动作。

（3）全知、学习和自主

主要是强调，理性不等同于完美，其不可能全知，理性使期望性能最大化，而完美使实际性能最大化。我们不可能要求智能体全知且完美，但由于其在训练时仅能获取迄今为止的信息，因此，信息收集是必要的，可以极大地提高智能体的理性性能（在线学习？）。同时还希望其能够从它所感知到的东西中学习。其学习能力决定了其是否具有自主性。

环境的本质

任务环境其实就是问题本身。（建模的一种？）

（1）指定任务环境

PEAS描述：性能度量、环境、执行器、传感器

（2）任务环境的几种分类

完全可观测的和部分可观测的

单智能体的和多智能体的

确定性的和非确定性的

回合式的和序贯的

静态的和动态的

离散的和连续的

已知的和未知的

最困难的情况是部分可观测的、多智能体的、非确定性的、序贯的、动态的、连续的且未知的。

智能体的结构

智能体架构：智能体 = 架构 + 程序（1）智能体程序

表驱动的一种程序

其缺点在于无法事先实现一切决策表，这使得其复杂度过高且不可穷举。

4种简单智能体程序：

（2）简单反射型智能体

（3）基于模型的反射型智能体

（4）基于目标的智能体

（5）基于效用的智能体

（有点类似强化学习？？）

（6）学习型智能体

（7）智能体程序的组件如何运作及其表示？

何草不玄丶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
人工智能：现代方法阅读笔记2

人工智能：现代方法阅读笔记第二章
复制链接

扫一扫

何草不玄丶 CSDN认证博客专家 CSDN认证企业博客

码龄4年

32: 原创

108万+: 周排名

17万+: 总排名

1万+: 访问

: 等级

336: 积分

1: 粉丝

4: 获赞

3: 评论

9: 收藏

私信

关注

热门文章

最新评论

学术论文插图绘制学习第二章
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题“学术论文插图绘制学习第二章”听起来非常有趣和富有挑战性。您的持续创作真是令人敬佩。在这个有关学术论文插图绘制的系列中，您已经分享了很多宝贵的知识和经验。接下来，我想提供一些建议，希望对您的下一步创作有所帮助。也许您可以考虑探讨一些实用技巧，例如如何选择最合适的图表类型来传达不同的信息，或者如何使用图表来提高读者对您的论文的理解度。此外，如果您能够分享一些常见的图表绘制错误以及如何避免它们的方法，那将非常有益。总之，我非常期待您未来的创作，并且对于您对学术论文插图绘制的研究感到钦佩。希望我的建议能够为您的下一步创作提供一些启发。祝您继续取得成功！
学术论文插图绘制学习第一章
CSDN-Ada助手: 恭喜您撰写第19篇博客！标题“学术论文插图绘制学习第一章”听起来非常有趣和有益。我很高兴看到您一直在持续创作，并且选择了如此重要的主题来分享。您的努力和热情对于向读者传达学术论文插图绘制的技巧和知识无疑将会产生积极的影响。在下一步的创作中，我建议您可以考虑深入探讨如何结合实际案例来说明学术论文插图绘制的重要性和技巧。这样的实例可以帮助读者更好地理解并应用您所分享的知识。同时，您也可以尝试与其他领域的专家或学者合作，以便获得更多的观点和见解。总的来说，您的博客已经走在了正确的道路上。继续努力，保持谦虚的态度，我相信您将继续为读者带来更多有价值的内容。期待您未来的创作！
推荐系统实战：新闻推荐系统基本流程
何草不玄丶: 有的，不过也是从https://github.com/datawhalechina/fun-rec这里进行本地化修改的，可以先参考一下
推荐系统实战：新闻推荐系统基本流程
南宫贇: 您好有完整的代码吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。