石头剪刀布自学习人工智能
前言
先点关注,不迷路
前一段灵光一现,想出了这个算法
不知道以前有没有人写过(应该是有的)
不过我觉得我还是可以大概说一下我的想法
还是那句话,讲得不好勿喷~
思路
既然是自学习,那肯定是得学习的
石头剪刀布这个游戏本身可能是没什么可学的,随机数就可以获得不错的胜率
由于胜负是由两个人的决策决定的,只能通过随机+猜对手的决策来进行决策,不存在永远获胜的方案
因此可以通过学习对手通常的决策或是偏好来提高胜率
另外,石头剪刀布可以抽象成0, 1, 2或1, 2, 3
本人这里用的1, 2, 3(没错,很脏)
存储结构
存储单元:每个存储单元有三个数据组成a1, a2, a3, n分别表示对手出1, 2, 3, 总数的个数
//memory point
struct memPoint{
int _list[4];
int _all;
};
这里用all(n)而不用概率是因为要避免小数
每个的概率就是ai / all
整个存储结构就由很多个存储单元组成
至于多少个,各位可以按照自己的想法自己设计
我这里用了3*3的,表示上一轮我和对手的状态
//0~3->4
memPoint _mem[4][4];//last turn status->foe decision