通过俄罗斯方块浅谈游戏中的AI(七)提升

开场随着前面我相对还比较会的技术渐渐用光,我一段时间非常满足紧接着一段时间非常无力

本来我每天喜欢看几次电脑中间PK,看看电脑如何使用我不会用的招数,感觉到很满足

我再给同学玩,同时自己也挑战几把电脑,发现确实很难赢它,我又很满足

后来同学及自己均发现了一些评价上的不足,挑整后,感觉明显屏蔽了原来的问题了,又感觉很满足

电脑曾经玩出了11w多的高分,突破了速度9一万分,我满足的不得了......

一切都好像很美好,总认为仅需要在评价这里挑战一下参数,整个水平就会提高不少......

 

可是一切的美好在昨天凝滞了,虽然我感觉它暴露的问题越来越少,虽然感觉它日益进步,但是昨天晚上它几乎没有赢过我!!或者没有这么夸张,至少我的胜率超过1/2!这个在以前是绝无仅有的,即使它以前有很多很多的漏洞,在某些情况下,总是犯傻,但是我也很难以1/2的胜率跟它对战!现在竟然发生这种情况!!

 

我不服气的跟它一把一把的对战,总希望它给我一些惊喜,但是发现,它始终难以突破1/2的胜率门槛。

 

我只好重新思考这个AI的思路,然后我发现了一个最大的问题,不是来自于计算机的,而是来自于哲学范畴的,来自于我们老祖宗儒家思想的--中庸之道


 

是一次一次的修改,让我的程序中庸了,没有特点了,一次一次的平衡,平衡就是为了让它不犯傻,结果原来最犀利的东西现在都消失了,以前AI比较执着的东西被平衡掉了。

这就是我们老祖宗留下来的所谓最有价值的东西,我不想批判它,它对我们的生活来讲,也许是个不错的想法,既然没有那么多伟人,何不活地没有那么多锋芒,同时也没有那么多风险。


没有想到,一个游戏能有让我如此的联想,我甚至在想,如果以后培养孩子,会不会也是这样?自己的某些人生决策,是不是也这样?我无力了......


进入正题

中庸好不好?没有人能回答,但是我认为中庸不代表没有个性,在大丈夫认为必须坚持的时候必须能做到当仁不让。

回到游戏中,

1.本来等棍子等得好好的,忽然发现经常因为等棍子让它经常积累的很高,很危险,于是就给它加了个门槛:当高度超过多少的时候,扣多少多少分(平方或立方级别的上升扣分力度),结果它不在犯傻去累积高度;

2.本来要消除大量的空位子,让空位子越少越好,结果由于总去消除空位子,也让它越累越高(害怕产生新的空位子嘛)于是累积高低差太大进行了的惩罚;

3.当等两个棍子才能解决问题的情况下,由于两个棍子太难等,强制让它填一个,变成等一个长棍子。

看起来这三种决策都没有太大的问题,可是最终导致的就是没有特点!没有特点的后果就是很平庸,最终任何人都可能因为运气打败它,高手可以通过技术技巧打败它。最后它的战绩反而不如开始的经常胜利。

电脑如果输了,大家可能认为自己是利用了电脑的一个bug赢得,如果电脑改进了,可能自己并赢不了;殊不知,电脑即使改变了所有的问题,如果没有一个思想主导,只是一味的强调屏蔽风险,最终就是一个平庸的电脑。

是什么导致了中庸!


有了这些假设,我准备把电脑做成有主见的电脑,不难在任何情况下都一成不变的守规矩。无数的人才都是埋没在规矩下的,规矩是给平庸人使用的,结果却把很多不平庸的人给平庸化。我的AI程序也不希望平庸,它要改进,要更强。

 

如何去做到这点?

我的知识水平并不够,也许是模式识别?也许是其它什么技术,但是我并不删除,我能想到的就是,让它能对局势进行判断,能确定阶段目标,不难被一成不变的规矩束缚,如果认为当前就应该疯狂进攻的情况下,其它都可以放一放;如果认为就应该防守的时候,无论如何都要消除更多的洞。这样才更像一个人,不是一段程序。

至于怎么去做,只好先等等我的设计吧,也许整个AI会推翻重做,也许会总结一套资料,与大家共享,也许会用到其它产品的开发上。


不做只能站在表面,做过了才能有更多的认识,生活就是这样,人生也正是这样......

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值