人工智能下象棋，走一步，能看几步？｜漫画

最新推荐文章于 2024-10-21 13:08:42 发布

亲爱的数据

最新推荐文章于 2024-10-21 13:08:42 发布

阅读量1.2k

点赞数 4

文章标签：人工智能算法强化学习深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39640818/article/details/126882225

版权

图文原创：谭婧

谭婧老师爱下象棋，就是谁也赢不了。

去公园下了一盘棋，第一步我就走了一个当头炮，剩下的都是大爷们帮我走的。

结果，我输了。

经过他们的总结研究，我第一步走错了。

2022年，象棋AI下棋机器人，问世了。

我和它对弈了一盘，结果，我赢了。

很有自知之明的我，严重怀疑设计者增加了噪音，降低了棋力。让我赢得很舒服。

但我没有证据。

怎么说呢，我就喜欢高情商的AI象棋机器人。

低情商的机器人只会冷漠地碾压我：“下不过我，就别废话。”

仿佛不仅嫌弃我棋臭，还嫌弃我话多。

而高情商的AI象棋机器人，大为不同。

它伸出胳膊，温柔地摆出“请”的姿势，它居然有机械臂。

情商和机械臂都不是重点，聊聊它的智商从何而来。

AI象棋机器人是人工智能技术中深度学习与强化学习的成果，击杀四方。

任何人工智能都离不开数学基础原理，在此，首先得感谢尊敬的贝尔曼（Bellman）教授。

以他名字命名的贝尔曼方程，在绝大多数强化学习的成果中都会用到，比如象棋AI下棋机器人的远方表哥，自动驾驶。

它们是亲戚，“血缘关系”是“最优决策”。

强化学习是要在多种决策中评价，找出好的决策。

强化学习在象棋中，就是在多种走法中找到最好的走法。

围观数学公式的人少，围观下象棋的人多。

我们抛开公式，用决策树表示每一步的输赢，非常直观。

一盘三十步的象棋比赛，会是一颗很大的决策树，有很多枝叶。

计算机下象棋的棋力，早就超越了绝大多数的人。然而，至今没有任何一款计算机软件达到全知全能的“棋神”状态，连AI也不行。

那在下象棋这件事情上，AI这几年在忙活啥？

那要从几十年前讲起了。

1980到1990年代，深蓝计算机是大公司的，小霸王游戏机是大家的。

假如一个人类象棋高手下一步棋，能看未来八步棋。就好比一下能想到决策树上的第八层。

传统象棋软件说，这我也行。

话是没有吹牛，传统象棋软件确实可以做到。

可是，再往前多算几步，所耗时间和计算存储可能都要翻倍。或者说，情况急转直下。

在旧式象棋软件的时代，得想办法减少计算量。所以，有了阿法贝塔剪枝。

这虽然有“偷懒”的嫌疑，但我也没有证据。

阿法贝塔剪枝的方法，相当于提前知道哪些搜索是没有意义的，排除错误答案，用巧思“偷懒”，相当于省略做题过程。

旧思路在象棋上还能支撑，用在围棋上力有不逮。

（因为围棋是19×19的一个矩阵，每步可选择的走法要比象棋多一个数量级。）

从旧式象棋软件时代，人们就为棋力算分。这是一个起源很早的好办法。

那么得分是怎么来呢？

用一个数学函数把有利赢棋的因素都考虑进去。

以至于，中国象棋协会也有象棋大师用此来构思好棋。

有了分数，僵化的下象棋，就是“哪步得分高，就走哪步”。

然而，象棋是一个非常讲究全局观的游戏。

追求最终取胜，不追求每一步占尽优势。

比如，战术性丢车保帅。

深度学习模型在象棋面前暴露了“缺点”，它算出当下局面的胜率，但是，并不能估算出后续局面的胜率。

所以，需要一个重要的动作来加持：搜索。

从决策树上理解，就是考虑的越多越好。

如今，能搜索到决策树里非常深的层数，这就意味着，招数更多，棋路更多，对胜利的把握就越大。

谈到如何处理搜索量大，就谈到了蒙特卡洛树搜索是学霸特供技能，对大多数人来说，都很难。

甚至可以这样说，就是题目很困难，算不出来，只好求助于概率，求助于实验。

一顿猛如虎的严谨分析算不出来。来吧，学霸直接撸起袖子做实验。

蒙特卡洛方法的做法虽然看起来比较随意，但却有着坚实的理论基础：大数定律。

在计算机眼里，棋子挪动一步，都算一个新的棋局，所以棋局数量何其之多。

一个厮杀正酣的棋局，往后走，可能衍生出10000种棋局。

借助蒙特卡洛树搜索这一方法，看未来几步怎么走。或者说，当AI象棋机器人，有了强化学习，就有了“大局观”。

我们马上进入学霸区特供：《AI象棋机器人所用的蒙特卡洛树搜索》。

这就是深度强化学习，模型收敛的目标是，把胜率估计越准越好。经过多轮训练，胜率会越来越准。

胜率是AI象棋机器人的KPI，每下一步都估算胜率。每一步，尽量把胜率提高。

常识是，高手胜率高，低手胜率低。

问题来了，高到多少，低到多少。每一步的胜率很难准确估算，只能估大致范围。

而且，把胜率提高的前提是，得把胜率算准确。

在如此模糊的情况下，数据里会有误差。因为有误差，所以AI象棋机器人只能知道“棋神”的方向是什么，它想方设法逼近这个方向。

象棋AI机器人的棋力水平的训练方法是，AI，加上蒙特卡洛树搜索，然后再教导AI本身。

这个过程类似总结经验，这样使得它的棋力飙升。

可以说，AI象棋机器人强大之处得益于蒙特卡洛树搜索。

超越人类是很早以前的本事了，现在追求棋力丝滑上升，情商在线。

让棋力水平菜，还有棋瘾的人，也能玩得开心（请不要在我下象棋的时候安装监控）。

好了，

这回就聊到这吧。

看在象棋AI下棋机器人输给我的份上，我不妨透露两个消息。

第一，有一版的AI象棋机器人初级棋力就打败了全公司的挑战者。

大胜之际，算法设计工程师们哀嚎遍野：“大事不妙”。

第二，我下赢AI象棋机器人那一局的时候，旁边有三个AI工程师帮忙出主意。

（哦，第二点是在凡尔赛科技新媒体的日常）

最后隆重介绍一下我们的全文审核专家：

更多阅读

1. 我怀疑京东神秘部门Y，悟出智能供应链真相了

2. 超级计算机与人工智能：大国超算，无人领航

3. 隐私计算：消失的人工智能 “法外之地”

4. 售前，航空母舰，交付，皮划艇：银行的AI模型上线有多难？

5. 两大榜单揭晓啦，2021年中国高性能计算机性能TOP100+国际人工智能性能排行榜AIPerf500

漫画系列

1. 万字大稿深度解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟，AI运维不是兄弟吗？

3. 大数据的社交牛逼症是怎么得的？

4. AI for Science这事，到底“科学不科学”？

5. 想帮数学家，人工智能算老几？

6. 给王心凌打Call的，原来是神奇的智能湖仓

7. 原来，知识图谱是“找关系”的摇钱树？

8. 为什么图计算能正面硬刚黑色产业薅羊毛？

9. AutoML：攒钱买个“调参侠机器人”划算吗？

10. 你爱吃的火锅底料，是机器人自动进货丨漫画AutoML

AI框架系列：

1.搞深度学习框架的那帮人，不是疯子，就是骗子（一）

2.搞AI框架那帮人丨燎原火，贾扬清（二）

DPU芯片系列：

1.造DPU芯片，如梦幻泡影？丨虚构短篇小说

2. 永远不要投资DPU？

3. DPU加持下的阿里云如何做加密计算？

4.哎呦CPU，您可别累着，兄弟CIPU在云上帮把手

最后，再介绍一下主编自己吧，

我是谭婧，科技和科普题材作者。

为了在时代中发现故事，

我围追科技大神，堵截科技公司。

偶尔写小说，画漫画。

生命短暂，不走捷径。

个人微信：18611208992

原创不易，多谢转发

还想看我的文章，就关注“亲爱的数据”。

亲爱的数据

博客等级

码龄8年

199
原创

582
点赞

630
收藏

459
粉丝

关注

私信

热门文章

最新评论

对抗NVLink简史？10万卡争端，英伟达NVL72超节点挑起
iamrichard: 好文章要顶
云从科技从容大模型：大模型和AI平台什么关系？为什么造行业大模型？
CSDN-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 上传ChatGPT/计算机论文等资源，瓜分￥5000元现金: https://blog.csdn.net/VIP_Assistant/article/details/130196121?utm_source=csdn_ai_ada_redpacket 新人首创任务挑战赛: https://marketing.csdn.net/p/90a06697f3eae83aabea1e150f5be8a5?utm_source=csdn_ai_ada_redpacket Microsoft Edge功能测评！: https://activity.csdn.net/creatActivity?id=10403?utm_source=csdn_ai_ada_redpacket 职场解惑讨论会: https://activity.csdn.net/creatActivity?id=10427?utm_source=csdn_ai_ada_redpacket 可持续能源技术真的能改变世界吗？: https://activity.csdn.net/creatActivity?id=10425?utm_source=csdn_ai_ada_redpacket 无效数据，你会怎么处理？: https://activity.csdn.net/creatActivity?id=10423?utm_source=csdn_ai_ada_redpacket 物联网技术正在如何影响我们的生活: https://activity.csdn.net/creatActivity?id=10421?utm_source=csdn_ai_ada_redpacket 生物识别技术能否成为应对安全挑战的绝佳选择？: https://activity.csdn.net/creatActivity?id=10411?utm_source=csdn_ai_ada_redpacket 应届生如何提高职场竞争力: https://activity.csdn.net/creatActivity?id=10409?utm_source=csdn_ai_ada_redpacket 讯飞星火大模型将超越chatgpt？: https://activity.csdn.net/creatActivity?id=10407?utm_source=csdn_ai_ada_redpacket 职场新人备忘录: https://activity.csdn.net/creatActivity?id=10405?utm_source=csdn_ai_ada_redpacket “裸奔”时代下该如何保护网络隐私: https://activity.csdn.net/creatActivity?id=10401?utm_source=csdn_ai_ada_redpacket VR vs AR：哪种技术更有潜力改变未来？: https://activity.csdn.net/creatActivity?id=10399?utm_source=csdn_ai_ada_redpacket 蓝桥杯备赛指南分享: https://activity.csdn.net/creatActivity?id=10317?utm_source=csdn_ai_ada_redpacket
独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow，光年之外欲添新大将...
samRsa: 本文作者照片好漂漂
独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow，光年之外欲添新大将...
赵4老师: 本文作者照片好漂漂
清华系创企RealAI：独家“隐私保护机器学习”技术，全球首款编译级产品
普通网友: 收获很多，谢谢大佬的分享，要是能得到大佬的点赞必是极好的

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。