石头剪刀布自学习人工智能

石头剪刀布自学习人工智能

前言

先点关注,不迷路

前一段灵光一现,想出了这个算法
不知道以前有没有人写过(应该是有的)
不过我觉得我还是可以大概说一下我的想法
还是那句话,讲得不好勿喷~

代码详解

思路

既然是自学习,那肯定是得学习的
石头剪刀布这个游戏本身可能是没什么可学的,随机数就可以获得不错的胜率
由于胜负是由两个人的决策决定的,只能通过随机+猜对手的决策来进行决策,不存在永远获胜的方案
因此可以通过学习对手通常的决策或是偏好来提高胜率

另外,石头剪刀布可以抽象成0, 1, 2或1, 2, 3
本人这里用的1, 2, 3(没错,很脏

存储结构

存储单元:每个存储单元有三个数据组成a1, a2, a3, n分别表示对手出1, 2, 3, 总数的个数

//memory point
struct memPoint{
   
	int _list[4];
	int _all;
};

这里用all(n)而不用概率是因为要避免小数
每个的概率就是ai / all

整个存储结构就由很多个存储单元组成
至于多少个,各位可以按照自己的想法自己设计
我这里用了3*3的,表示上一轮我和对手的状态

//0~3->4
memPoint _mem[4][4];//last turn status->foe decision
  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值