1-2讲

最新推荐文章于 2024-10-06 21:14:34 发布

Aviva迪迪

最新推荐文章于 2024-10-06 21:14:34 发布

阅读量846

点赞数

分类专栏：机器智能文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43369716/article/details/116142250

版权

机器智能专栏收录该内容

2 篇文章 0 订阅

订阅专栏

目录

一、人工智能的历史

1、现实的困难
翻译、不同组合求解局限于小问题、产生智能行为的基本结构的根本局限性（感知机）

2、基于知识的系统——专家系统仅限于局部领域没有学习能力

3、知识引擎的新发展
成为产业、神经网络的回归、其他机器学习方法的出现、智能Agent及其应用、极大数据集的可用性

二、智能Agent

Agent通过感知器感知环境并通过执行器对所处的环境产生影响
eg：机器人Agent——摄像头、红外测距仪

1、理性Agent

（信息收集、自主性、能够进行学习）

①一个Agent应该根据她所感知的信息而产生一个行为
②该行为是正确的（该行为能取得最大的性能）

理性判断的4个因素（吸尘器问题）
①先验知识（地形）
②可以完成的动作（向左向右吸尘）
③截至此刻的感知序列（位置和灰尘）
④性能度量（清洁加分）

2、学习Agent

4个组件：
①性能元件：相当于整个Agent
②评判元件：反应性能元件做得如何
③学习元件：负责改进提高
④问题产生器：提出一些新的有建设性的探索尝试
（出租车行驶）

3、任务环境（▲）

1、任务环境四要素：

性能、环境、执行器、感知器

2、环境的性质

①完全可观察、部分可观察
在每个时间点上获取环境的完整状态（国际象棋）和部分状态（自动驾驶汽车）。

②单Agent、多Agent
独自运行（字谜游戏）、同时运行（国际象棋）

③确定的、随机的
确定的环境下一个状态完全取决于当前状态和agent执行的行为，否则为随机的（真空吸尘器、出租车驾驶）

④片段式的、延续式的
agent经历被分成一个个原子片段，下一个片段不依赖于以前的片段（检查次品零件的机器人）
延续式的环境当前决策影响未来（国际象棋）

⑤静态的、动态的
环境在agent计算时不会发生变化、会变化

⑥离散的、连续的

4、Agent程序

①以传感器得到的当前感知信息为输入
②以执行器的行为为输出
仅仅以当前感知为输入而不是以整个历史感知为输入

Agent的表驱动方法——表太大、创建表时间长、非自主性、需要人工填写

5、Agent的类型（▲）

四种基本类型：

①简单反射agent
基于当前的感知选择行为，不关注历史（真空吸尘器、刹车行为）

②基于模型的反射agent
Agent根据感知历史维持内部状态、随时更新内部状态信息

③基于目标的agent
除了根据感知信息之外，还要根据目标信息来选择行动，效率比较低，需要推理（搜索和规划算法）

④基于效用的agent
当达到目标行为有很多种的时候，就需要考虑效率
用途：
环境是部分可观察和随机的，不确定下的决策过程可以通过基于效用的agent来实现（在不确定环境中）、多目标冲突、一个目标有多种行为可以达到

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。