人工智能之对抗搜索

对抗搜索

1 为什么要学习对抗搜索?

上文开篇我们说了为什么要学习一点算法:不求能上天飞黄腾达,但至少得知道将来干掉自己的是谁,不能走的不明不白,是不?

李开复曾经把基础课程比拟为“内功”,把新的语言、技术、标准比拟为“外功”。 整天赶时髦的人最后只懂得招式,没有功力,是不可能成为高手的。真正学懂计算机的人(不只是“编程匠”)都对数学有相当的造诣,既能用科学家的严谨思维来求证,也能用工程师的务实手段来解决问题——而这种思维和手段的最佳演绎就是“算法”。
在这里插入图片描述

对抗搜索是一类算法的算法的总称,也是机器学习的一个分支。那我们为什么要学习对抗搜索呢?实在点,学它对我们有什么用?能增收或撩妹不?你总得给我个理由是不!

为了回答这个问题,我们先看一下这张图,也是AI的发展简史:
在这里插入图片描述

从图中可以看到,1997年Deep Blue世纪大战和2016年AlphaGo击败李世石,其中的关键技术即是对抗搜索技术。在棋类游戏里AI已经超过了人类,另外,在我们数学部分第一讲的概述中也提到了同样的问题,AI在计算机视觉领域(如ImageNet的识别)等也是远远优于人类的。**刺激不?危机不?**那怎么办呢?

成年人别问那么多,直接学就完了!

再举一个棋类例子:设想你在玩井字棋:

井字棋是一种在3 * 3格子上进行的连珠游戏,和五子棋类似,分别代表O和X的两个游戏者轮流在格子里留下标记(一般来说先手者为X),任意三个标记形成一条直线,则为获胜。

正常情况下,你的目标是赢,除非...对方是个妹纸,如何轻松赢得棋局,学完这部分内容,你将赢棋把妹两不误!不说废话了,开搞吧:joy:

2 什么是对抗搜索?

老规矩,为了方便描述,我们先介绍几个概念,有个先验印象,对抗搜索涉及几个常见概念:智能体、对抗搜索和博弈树。

智能体

智能体(agents):在信息技术尤其是人工智能和计算机领域,可以看作是能够通过传感器感知其环境,并借助于执行器作用于该环境的任何事物。以人类为例,我们是通过人类自身的五个感官(传感器)来感知环境的,然后我们对其进行思考,继而使用我们的身体部位(执行器)去执行操作。类似地,机器智能体通过我们向其提供的传感器来感知环境(可以是相机、麦克风、红外探测器),然后进行一些计算(思考),继而使用各种各样的电机/执行器来执行操作。现在,你应该清楚在你周围的世界充满了各种智能体,如你的手机、真空清洁器、智能冰箱、恒温器、相机,甚至你自己。

对抗搜索

对抗搜索也称为博弈搜索,在人工智能领域可以定义为:有完整信息的、确定性的、轮流行动的、两个游戏者的零和游戏(如象棋)。

  • 游戏:意味着处理互动情况,互动意味着有玩家会参与进来(一个或多个);

  • 确定性的:表示在任何时间点上,玩家之间都有有限的互动;

  • 轮流行动的:表示玩家按照一定顺序进行游戏,轮流出招;

  • 零和游戏:意味着游戏双方有着相反的目标,换句话说:在游戏的任何终结状态下,所有玩家获得的总和等于零,有时这样的游戏也被称为严格竞争博弈;

    关于零和,也可以这样来理解:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而双方都想尽一切办法以实现“损人利己”。零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。

例如下井字棋,一个游戏者赢了+1,则另一个一定输了-1,总和等于零。

博弈树

考虑两个游戏者:MIN和MAX,MAX先行,然后两人轮流出招,直到游戏结束。在游戏最后,给优胜者积分,给失败者罚分。

在这里插入图片描述

游戏可以形式地定义成含有下列组成部分的一类搜索问题:

  • 初始状态,包含棋盘局面和确定该哪个游戏者出招。
  • 后继状态,返回(move,state)对(两项分别为招数、状态)的一个列表,其中每一对表示一个合法的招数和其结果状态。
  • 终止测试,测试判断游戏是否结束,游戏结束的状态称为终止状态。
  • 效用(收益)函数,效用
  • 14
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值