通过神经网络进行评估棋局的状态,这是一个非常好的策略。
因此我们可以进行从这一步进行选择下一步的操作,下那一步棋(搜索最大的下一步棋局状态)。
神经网络的权值是通过进化算法得到的。
我们有一个关于权值的群组,通过在线和其他棋手进行博弈,之后我们可以选择在一定场次内,胜率比较高的作为适应值。
从而通过多少次迭代之后,我们可以得到最优的神经网络的权值。
这个属于最优的。
因此,完成 了对博弈的学习。
通过神经网络进行评估棋局的状态,这是一个非常好的策略。
因此我们可以进行从这一步进行选择下一步的操作,下那一步棋(搜索最大的下一步棋局状态)。
神经网络的权值是通过进化算法得到的。
我们有一个关于权值的群组,通过在线和其他棋手进行博弈,之后我们可以选择在一定场次内,胜率比较高的作为适应值。
从而通过多少次迭代之后,我们可以得到最优的神经网络的权值。
这个属于最优的。
因此,完成 了对博弈的学习。