通过俄罗斯方块浅谈游戏中的AI(八)发现

通过俄罗斯方块浅谈游戏中的AI(七)提升 一节并不是很好实施,在我还没有得到更好的可执行方案的情况下,我对于当前的评价体系部分有了新的发现


 

话说最早的时候代码中有个bug,在判断连续两个方块下落的分数时,我使用

总score=方块1引起的局势得到的score + 方块12联合引起的局势得到的score;

很显然这是有问题的,12联合引起的局势是最终局势,仅方块1引起的局势无论如何都不影响总score。所以我改了这个bug =》总score= 方块12联合引起的局势得到的score

好像这样就解决了似的,但是这里又引入了一个很不易发现的问题。


我的score评价体系分三个部分,在前面章节有说明;

局势score = 消除行score(不是100,300,700,1500这几个分,是评价分)

+ 空格score + 最上层形势score ;

最后两部分没有的说,空格越少,上层越平整(如果不考虑消除多行)分数越高。

有几个网友告诉我,不应该用消除行分数,但我为什么要对消除行进行评价呢

 

--为了疯狂的消除4行!为了疯狂的进攻。如果不评价分数,电脑为了局势平和会一行一行的消除,进攻就不犀利,根本就是任人宰割!

但加上消除行评价以后,在非常安全的阶段,如果电脑敢消除1行我就敢给电脑扣分,于是,电脑老老实实的攒4行。

 

但评价了消除行又能引来什么问题呢?引用黎叔的名言:后果很严重!

 

因为第一步的评价产生的失误被屏蔽,因为第一步消除行产生的效果被屏蔽;

于是乎,电脑不是很在意是不是第一步产生一个空,只要第二步有可以消除这个空的步骤,它就欣然的去创造这个洞,因为对第二步的评价不光消除了洞,同时还消除了行,双赢。

这是多么的自欺欺人啊!

我说怎么看电脑之间pk的时候,他们总是喜欢给自己造麻烦,我当时看到第二步都把麻烦解决了,还有意思的想,电脑怎么这么喜欢耍宝!!!原来是因为这个问题!!!

是我的bug让电脑在耍宝,有的时候还没有耍玩,对方给它加了一行,结果上一一行,宝就刷砸了!!^_^

 

改掉这个问题,就必须重新考虑这两步造成的影响,至少不能让电脑总是喜欢在第二步的评价得高分。因为这里有个最大的问题,由于是递推,当到了第二步的情况下,第二步又变成了第一步!这就可能让电脑不停地犯傻!确实后果很严重吧?

 

这个评价后果我想可能是因为消除行评价引起的,最简单的解决方案就是把第一步和第二步的消除行分别进行评价,合起来算总分。但是对于耍宝这点,我还真挺讨厌的,有的时候明明不需要耍宝,但是如何治它还真不好说,以前的时候是第一步排名前6的才进行第二步评价,这样耍宝的可能性会小一些,现在由于算法快了,所有步骤都进行了遍历,反而让耍宝变为可能!

真是又一段让人值得思考的章节!

篇后话:这个bug修改完毕,让这个AI又少了一种犯傻的机会,而且这种犯傻只有坏处没有益处。现在的版本在经过一次修正,又会变得犀利而有章程,期待明天的最新版本:)

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值