evolving checkers players [Fogel and Chellapilla, 2002]

通过神经网络进行评估棋局的状态,这是一个非常好的策略。

因此我们可以进行从这一步进行选择下一步的操作,下那一步棋(搜索最大的下一步棋局状态)。


神经网络的权值是通过进化算法得到的。


我们有一个关于权值的群组,通过在线和其他棋手进行博弈,之后我们可以选择在一定场次内,胜率比较高的作为适应值。

从而通过多少次迭代之后,我们可以得到最优的神经网络的权值。


这个属于最优的。


因此,完成 了对博弈的学习。




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值