Nashpy包学习（二）（关于里面的各种方法定义）

最新推荐文章于 2024-05-28 01:06:48 发布

木牙骓七

最新推荐文章于 2024-05-28 01:06:48 发布

阅读量993

点赞数

分类专栏：博弈论文章标签：机器学习算法 python

博弈论专栏收录该内容

2 篇文章 1 订阅

订阅专栏

一、创建博弈

零和博弈

import nashpy as nash
import numpy as np
A = np.array([[1, -1], [-1, 1]])
matching_pennies = nash.Game(A)
matching_pennies

非零和博弈

import nashpy as nash
import numpy as np
A = np.array([[3, 0], [5, 1]])
B = np.array([[3, 5], [0, 1]])
prisoners_dilemma = nash.Game(A, B)
prisoners_dilemma

二、计算收益

import nashpy as nash
import numpy as np
A = np.array([[3, 0], [5, 1]])
B = np.array([[3, 5], [0, 1]])
prisoners_dilemma = nash.Game(A, B)
#策略
sigma_r = np.array([1 / 2, 1 / 2])
sigma_c = np.array([1 / 2, 1 / 2])
#计算收益
prisoners_dilemma[sigma_r, sigma_c]

三、检查策略是否为最佳策略

行为空间为 $\mathcal{A}$ 的玩家的策略就是关于行为空间中每个行为的一个概率分布。

game.is_best_response(strategy1，strategy2)；

sigma_r = np.array([0, 1])
sigma_c = np.array([1, 0])
#检查是否为最佳策略
prisoners_dilemma.is_best_response(sigma_r, sigma_c)

四、找equilibrium的方法

Nashpy中实现的算法

game.support_enumeration()
game.vertex_enumeration()

最后会返回一个包括所有均衡的generator

game.lemke_howson(initial_dropped_label=0)
game.lemke_howson_enumeration()

五、Use fictitious play

fictitive_play 方法返回给定学习步骤集合的生成器

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

木牙骓七

关注关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Algorithm-Nashpy.zip

09-17

Algorithm-Nashpy.zip,两人博弈纳什均衡的计算库,算法是为计算机程序高效、彻底地完成任务而创建的一组详细的准则。

python模块和python包的区别

Ahhhhhhh8086的博客

05-02

139

python模块：即一个python文件，我们常说调用某个模块实际上是调用了某个python文件里的内容 python包：python文件的一个集合（相当于文件夹，但里面必须要有_init_.py文件）

参与评论您还未登录，请先登录后发表或查看评论

博弈论 NashPy是一个Python库

qq_40523298的博客

07-13

1175

经典的纳什均衡分析表明,这个博弈存在一个囚徒相互出卖的纯策略纳什均衡。无论你是老练的博弈论者还是刚起步,NashPy都提供了一种简单直观的方式来建模和分析策略互动,帮助你发掘它们的全部潜力,并更深入地理解周围的世界。支持枚举算法是一种更普遍的方法,因为它考虑了所有可能的支持对,而顶点枚举算法更高效,因为它只考虑最优响应多面体的顶点,这是最优响应集合的极点。这返回一个唯一的纯策略纳什均衡 (D, D),意味着双方都会选择背叛,尽管如果双方都选择合作(C, C)他们都能获得更好的结果。

Nashpy包学习（一）

qq_42100790的博客

11-03

2392

Nashpy包应用建立一个博弈并找出博弈的纳什均衡原文档传送用例：石头剪刀布 1. 基本内容这是一个典型的博弈过程，每个playerplayerplayer都有三个选择（在博弈论中称之为strategiesstrategiesstrategies）: 石头布剪刀胜利者的胜利条件为：石头粉碎剪刀布包住石头剪刀剪切布据此构建收益矩阵AijA_{ij}Aij A=(0−1110−1−110)A=\begin{pmatrix} 0 & -1 & 1\\ 1 &am

python中Numpy包的安装及使用

热门推荐

浪潮之巅的专栏

12-17

5万+

Numpy包的安装准备工作 Python安装 pip安装将pip所在的文件夹添加到环境变量path路径中下载相应的Numpy安装包，.whl格式。下载链接. 以上准备工作准备完毕之后，进行Numpy安装，先进入whl安装包的存放目录。比如在C盘：cd C:\再使用命令行安装：pip install numpy文件名.whl至此，Numpy的安装完成。Numpy使用举例import numpy a

纳什均衡C++简单实现

微醺半夏的博客

06-15

1751

由于本人实力有限，python和算法目前都不太熟练，于是用简单的画圈法来实现纳什均衡。主要思想：对A：确定B的一个策略，然后遍历A的所有策略，保存最大值的下标以及收益，如果有相等的就都记录下来。判断纳什均衡：如果策略组的两个策略互为最佳应对，那么这个策略组就构成一个纳什均衡。只需遍历A的所有对B每个策略的所有最佳应对，然后查找B相应的策略，看A是否是该策略的最佳应对。相当于查看B的策略是否在这个圈内，如果是的话这个策略组就形成了纳什均衡。 ......

python安装numpy包教程等其他相关包_Python中Numpy包的安装与使用方法简明教程

weixin_39870132的博客

12-04

289

本文实例讲述了Python中Numpy包的安装与使用方法。分享给大家供大家参考，具体如下：Numpy包的安装准备工作1. Python安装2. pip安装(如使用pip安装命令：pip install numpy)3. 将pip所在的文件夹添加到环境变量path路径中4. 下载相应的Numpy安装包，.whl格式。下载链接.以上准备工作准备完毕之后，进行Numpy安装，先进入whl安装包的存放目录...

Nashpy：用于在两个玩家游戏中计算Nash平衡的库

01-31

通过设计，Nashpy易于安装：最简单的安装方法是从pypi： $ python -m pip install nashpy 用法通过传递两个二维数组/列表来创建双向矩阵游戏： >> > import nashpy as nash >> > A = [[ 1 , 2 ], [ 3 , 0 ]] >> >...

Nashpy-master.zip

05-03

Nashpy: a python library for the computation of equilibria of 2 player strategic games. Nashpy: a python library for the computation of equilibria of 2 player strategic games.

《多智能体学习：强化学习方法》——代码实现

qq_44852767的博客

05-03

8028

文章目录Nash-QLearning智能体创建一个矩阵环境策略训练Minimax-QLearning¶WoLF-PHC(Policy hill-climbing algorithm) Nash-QLearning 论文：Nash Q-learning for general-sum stochastic games 链接：http://www.jmlr.org/papers/volume4/hu0...

Python-Nash一个用于计算2人策略游戏的平衡的python库

08-10

Nash 一个用于计算2人策略游戏的平衡的python库

一切皆是映射：AI Qlearning博弈论视角解读

最新发布

程序员光剑

05-28

344

1.背景介绍在人工智能发展的历程中，Q-learning作为一种强化学习算法，它的出现极大地推动了人工智能领域的发展，特别是在游戏、机器人等领域有着广泛的应用。而博弈论作为一种研究决策的数学理论，它的出现让我们对于复杂的决策问题有了新的理解和处理方式。本文将从Q-learning和博弈论的视角，探讨它们在人工智能领域的应用和影响。

python numpy库作用_python常用库 - NumPy 和 sklearn入门

weixin_39778003的博客

11-21

638

Numpy 和 scikit-learn 都是python常用的第三方库。numpy库可以用来存储和处理大型矩阵，并且在一定程度上弥补了python在运算效率上的不足，正是因为numpy的存在使得python成为数值计算领域的一大利器；sklearn是python著名的机器学习库，它其中封装了大量的机器学习算法，内置了大量的公开数据集，并且拥有完善的文档，因此成为目前最受欢迎的机器学习学习与实践的...

博弈论Python仿真（一）

帅帅气气的黑猫警长

05-26

5264

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构（incentive structure），所以它们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境。具有竞争或对抗性质的行为称为博弈行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。博弈论就是研究博弈行为...

Python软件包的安装（3种方法）

python_9988的博客

09-02

2万+

有些 Python 软件包是系统自带的，如 sys，这些包在安装 Python 时已自动安装。但有些包是需要自行下载安装的，如 PIL。这些第三方的软件有的以源代码的形式提供，有的以安装包的形式提供。安装第三方 Python 包的方法有很多种。本节将介绍一些常见的方法。 1、复制源代码到系统目录最简单的方法就是将 Python 源文件复制到 sys.path 包含的某个目录下。这样使用“imp ort文件名”即可导入该包。#价位@762459510 免费领取python、爬虫配套实操资料# 下面的代码查

python numpy包在哪下载_Python Numpy包安装

weixin_39930252的博客

12-09

1156

1，下载python下载地址： https://www.python.org/downloads/windows/2，配置python环境变量在电脑的系统属性的系统变量path中添加python的安装路径，如在path中加入 ;F:\Python34;F:\Python34\Scripts;3，使用pip 指令安装numpy包3.1 打开dos命令输入 pip install numpy ...

二叉搜索树的第k个结点

pynash123的博客

04-11

题目: 给定一棵二叉搜索树，请找出其中的第k小的结点。例如，（5，3，7，2，4，6，8）中，按结点数值大小顺序第三小结点的值为4。思路： 1、中序遍历并用vector保存每个节点，此时vector中节点的值是按序存放的，返回vector中第k个值；此方法空间复杂度为O(K),而且要遍历完所有节点。 2、优化，中序访问至第k个节点，且只保存第k个节点的值，此方法空间复杂度为O(1),只...

python博弈矩阵分析器（功能不完善）

i道i的博客

09-11

1135

1. 由用户输入左方参与人和上方参与人的所有决策（用英文逗号分隔各个不同的决策），程序会自动对所有决策进行排列组合。2.用户根据提示，输入各种策略组合的得益（整数）。3.程序根据输入，输出博弈矩阵以及均衡点。

子集和问题算法_求解Nash均衡的子集枚举算法

weixin_39611765的博客

11-17

369

求解Nash均衡的子集枚举算法感觉查nash均衡只能查到经济学的东西，都是说2*2或者3*3的作业题怎么做的，很难找到一个解释通用算法的（给计算机专业的人看的）文章，所以专门记一下。双矩阵博弈(bimatrix game)双矩阵博弈由两个矩阵定义，它们分别是玩家1和玩家2的收益矩阵，行号i表示玩家1的行动，列号j代表玩家2的行动，则R矩阵的(i, j)位置的值表示玩家1的收益，C矩阵(i, ...

合作博弈python

08-14

在Python中，你可以使用博弈论库来进行合作博弈的建模和分析。一个常用的库是`Nashpy`，它提供了一些用于处理博弈论的功能。首先，你需要安装`Nashpy`库。你可以使用以下命令来安装： ``` pip install nashpy ``` 一旦安装完成，你就可以开始使用它来建模和分析合作博弈。下面是一个简单的例子来说明如何使用`Nashpy`库： ```python import numpy as np import nashpy as nash # 定义合作博弈的支付矩阵 payoff_matrix_A = np.array([[3, 0], [5, 1]]) payoff_matrix_B = np.array([[3, 5], [0, 1]]) # 创建博弈对象 game = nash.Game(payoff_matrix_A, payoff_matrix_B) # 计算纳什均衡 equilibria = game.support_enumeration() # 打印纳什均衡策略和支付矩阵 for eq in equilibria: print("纳什均衡策略:", eq[0], eq[1]) print("支付矩阵:", game[eq]) ``` 在这个例子中，我们定义了两个玩家的支付矩阵，并使用`nash.Game()`函数创建了一个博弈对象。然后，我们使用`support_enumeration()`函数计算纳什均衡，并打印出纳什均衡策略和支付矩阵。这只是一个简单的示例，`Nashpy`库还提供了其他功能，如计算混合策略、解决非合作博弈等。你可以查阅官方文档以了解更多信息。希望这个例子能帮助你入门合作博弈的Python建模！