写一个类似贪吃蛇的游戏
规则:
1.在一个有限空间内,A的上下左右有奖励,但A往哪个方向走是随机的,当A获取某个地点的奖励后该地点则没有了奖励
2.设立积分体制,到达有奖励的地方并作出获取奖励的动作则加分,到达没有奖励的位置却做出获取奖励动作则减分,没做出动作不增分不减分,撞到空间边界减分
3.每代A有200个,每个A需要用仅有的一个走图策略走500个随机生成的上述有限空间,每走一次图有每次的积分,将500次走图的平均分作为一个A的积分
4.使用遗传算法,让同一代中积分前50%的A繁殖,繁殖方式为交换部分走图策略,若干代之后进化出积分接近完美的A,将此时A的走图策略当为模板
引用:平均分是一种常用的评分方法,其由来可以追溯到18世纪。当时,法国学者阿德里安·马里·勒让德(Adrien-Marie Legendre)提出了一种求解观测值平均数的方法,这就是现在广泛应用的算术平均数。在这个方法中,所有观测值首先相加,然后再除以观测值的总数,就可以得到平均值。这个方法的优点在于,它能够反映出观测值的整体水平,而不会被一两个极端值所影响。因此,在各种领域的数据分析中,平均数经常被用来表示一个数据集的总体水平。