[学习笔记]博弈论

nim游戏

[学习笔记]nim游戏

公平组合游戏

就是一般的博弈,先手后手选择相同、交替行动,正负判定是能不能动为准。

SG函数

对于单独的游戏,0/1足以表示必胜必败态

SG函数主要处理多个游戏组合起来,即公平组合游戏

SG函数xor值为0,必败,否则必胜

SG函数定义为所有后继状态的mex值

其实只要规定好终态SG函数并且方便转移,公平组合游戏都可以用SG函数刻画

Every-SG 游戏

每个子游戏必须同时进行的组合游戏。

一个DAG上有多个棋子,每次选择所有能移动的棋子沿着有向边移动。

谁不能移动了谁输。

(最后一个棋子归位才是关键)

 

直观上感觉,要将必胜态保持更长,要将必败态保持更短

 

先找出必胜必败态,

当前是必胜态,D(T)=max(D(T'))+1

当前是必败态,D(T)=min(D(T'))+1

混合博弈

根据当前情况以一定概率决策

混合策略游戏

大概决策如下两种:
真诚(问自己没有的)欺骗(问自己有的)

再考虑对方“认为你真诚”,“认为你虚假”,做出的决策和你获胜的关系,


T-T:m/(m+1)(1-f(m-1,n))
T-F:1/(m+1)+m/(m+1)*(1-f(m-1,n))
F-T:1
F-F:1-f(m,n-1)
推出式子,求交点

假如以先手以P概率真诚,

最大化:
max(min(pm/(m+1)*(1-f(m-1,n))+(1-p),p/(m+1)+p*m/(m+1)(1-f(m-1,n))+(1-p)(1-f(m,n-1)))

f(m-1,n)和f(m,n-1)递归下去,

P是横坐标的话,

 

其实就是,两个直线求交点,横坐标的概率就是最优决策了,由最高处的纵坐标,再得到获胜的概率

例题

转载于:https://www.cnblogs.com/Miracevin/p/10427096.html

基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip基于MATLAB实现旅行推销员问题(TSP)的代码+项目说明(课程大作业)+测试数据.zip 【备注】 1、该资源内项目代码百分百可运行,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,不仅适用于小白学习入门进阶。也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载!欢迎交流学习!不清楚的可以私信问我!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值