![](https://img-blog.csdnimg.cn/20200704141847608.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
博弈论
文章平均质量分 94
博弈论基础知识学习笔记。
小小何先生
总是感觉自己是个英雄,还很帅!
展开
-
博弈论(二)完全信息静态博弈
文章目录Prisoners' DilemmaNormal-form (or strategic-form) representation2-player gamePrisoners' DilemmaIterated elimination of strictly dominated strategiesNash equilibriumBest Response Function依据最优反应定义纳什均衡Applications of Nash equilibrium最优反应求解纯策略纳什均衡严格剔除劣策略纳什原创 2020-12-12 10:16:32 · 9067 阅读 · 0 评论 -
博弈论(一)基本概念
文章目录囚徒困境双寡头削价竞争博弈博弈过程博弈信息结构 假设要在AB两点建立一个超市,假设AB两点中间的顾客都是均匀分布的,那如何选定两个超市地址呢?假设AB两点的中点为C点。 如果由政府来建,那么会建立在AC的中点D点,和CB的中点E点。如果二者自由竞争,那么两家超时都会建在C点(因为大家都想抢占多一点位置),出现扎堆的情况。博弈论就是在这里做的就是有竞争的情况下,预测合理的结果。囚徒困境坦白不坦白坦白(-5,-5)(0,-8)不坦白(-8,0)(-1,-1原创 2020-12-12 10:15:59 · 1658 阅读 · 0 评论 -
对抗搜索之【最大最小搜索】【Alpha-Beta剪枝搜索】
本节这里我们讨论的是确定的、完全可观测、序贯决策、零和游戏下的对抗搜索。 所谓零和博弈是博弈论的一个概念,属非合作博弈。指参与博弈的各方,在严格竞争下,一 方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在 合作的可能。 对抗搜索(Adversarial Search)一般指的是博弈双方会阻止对方收益最大化,也称为博弈搜索(Game Search)。在...原创 2020-02-22 22:11:43 · 4155 阅读 · 1 评论 -
启发式搜索 (Heuristically Search)-【贪婪最佳优先搜索】和【A*搜索】
搜索是人工智能里面研究的一个核心问题,像强化学习其本质我也是理解为一种搜索算法,不过其用了一些值函数近似的方法,并做了进一步改良,使其功能更加强大。近些年来也有非常多学术研究者慢慢开始将两者融汇贯通发顶会了。比如像Goog的planet,Muzero以及将熵用于蒙特卡洛树搜索中平衡探索和利用的关系等等。启发式搜索 启发式搜索(Heuristically Search)又称为有信息搜索(I...原创 2020-02-22 22:11:31 · 14461 阅读 · 2 评论 -
机器博弈 (一) 入门简介
我的微信公众号名称:深度学习与先进智能决策微信公众号ID:MultiAgent1024公众号介绍:主要研究分享深度学习、机器博弈、强化学习等相关内容!期待您的关注,欢迎一起学习交流进步!现代博弈论建立 现代博弈论的建立得从1944年算起,1944年冯·诺依曼的《博弈论与经济行为》以数学形式来阐述博弈论及其应用,标志着现代系统博弈理论的初步形成。冯·诺依曼被称为现代博弈论之父。Th...原创 2020-01-31 15:09:03 · 2296 阅读 · 1 评论 -
机器博弈 (二) 遗憾最小化算法
我的微信公众号名称:深度学习与先进智能决策微信公众号ID:MultiAgent1024公众号介绍:主要研究分享深度学习、机器博弈、强化学习等相关内容!期待您的关注,欢迎一起学习交流进步!...原创 2020-10-03 20:35:41 · 2770 阅读 · 0 评论 -
机器博弈 (三) 虚拟遗憾最小化算法
我的微信公众号名称:深度学习与先进智能决策微信公众号ID:MultiAgent1024公众号介绍:主要研究分享深度学习、机器博弈、强化学习等相关内容!期待您的关注,欢迎一起学习交流进步!虚拟遗憾最小化算法(Counterfactual Regret Minimization)如果不能遍历计算机所有节点的遗憾值,那么可以采用虚拟遗憾最小化算法来进行模拟计算。假设:集合AAA...原创 2020-10-03 20:35:48 · 4300 阅读 · 0 评论 -
机器博弈 (四)博弈规则的设计
我的微信公众号名称:深度学习与先进智能决策微信公众号ID:MultiAgent1024公众号介绍:主要研究分享深度学习、机器博弈、强化学习等相关内容!期待您的关注,欢迎一起学习交流进步!博弈规则的设计 博弈策略求解是博弈问题中的一个重要内容,另外一个重要的内容是博弈规则的设计: 也就是说,假设博弈的参与者都是足够理性的,如何设计一个博弈规则能确保公正性或者达到设计者的最大利益。主...原创 2020-01-31 15:10:23 · 1660 阅读 · 0 评论 -
【详细原理】蒙特卡洛树搜索入门教程!
我的微信公众号名称:AI研究订阅号微信公众号ID:MultiAgent1024公众号介绍:主要研究强化学习、计算机视觉、深度学习、机器学习等相关内容,分享学习过程中的学习笔记和心得!期待您的关注,欢迎一起学习交流进步! 本文是对Monte Carlo Tree Search – beginners guide这篇文章的文章翻译,以及对其代码的解释:1 引言 蒙特卡洛树搜索在200...翻译 2020-01-31 15:13:33 · 4718 阅读 · 0 评论