优化黑白棋估值参数

本文介绍了如何通过统计大量已知结果的黑白棋局,利用多元线性拟合优化估值模型中的权重参数,以降低局面估值误差的平方和。文中提出了迭代逼近方法,并讨论了迭代速率参数的选择对收敛性的影响。
摘要由CSDN通过智能技术生成
    实际是个统计工作。但这里不打算讲模板参数的计算,因为模板估值本身可能不少人还不了解,另外,模板参数计算起来非常复杂,虽然其原理并不难,详细原理请参考 http://www.cs.ualberta.ca/~mburo/ps/improve.pdf ,本文实际是对这篇论文的简化和个人理解。顺便说一下, http://www.cs.ualberta.ca/~mburo/publications.html 这里有很多关于黑白棋的论文,要写黑白棋的朋友不可不看。
    相信大家对稳定子、行动力、潜在行动力的概念都已经很清楚了。所以在此考虑一个简单的估值模型。f(p)=w1*f1(p) + w2*f2(p) + w3*f3(p),其中p为一个局面,f1是稳定子个数,f2是行动力,f3是潜在行动力,w1,w2,w3是他们的权重。要估值准确,就需要设置w1,w2,w3的值,通常我们都是猜测他们的值,或根据经验来设定。但是这样不能达到最优。实际上,我们可以统计大量的已知结果的棋局,来求出他们的值。对于已知的棋局,其结果是已知的,那么对于大量的棋局,我们要使得每个局面下通过f(p)计算得到的值尽量接近最终结果,这就是一个多元线性拟合问题。最终的目的是使每个局面的估值误差的平方和(我认为绝对值的和也可以)达到最小化。
    对于这类问题,一般可以用多元线性回归来求解,求解一个方程组。但对于这里的情况而言,由于样本数量巨大,可达数
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值