人机大战|深度拆解AlphaGo套路

最新推荐文章于 2022-01-06 20:13:38 发布

ccnanxi

最新推荐文章于 2022-01-06 20:13:38 发布

阅读量1.9k

点赞数 2

人工智能与人类智慧的再一次正面对决，5月23日上午，“中国围棋峰会”在乌镇拉开帷幕，备受关注的世界第一棋手柯洁与AlphaGo 2.0的第一场比赛于10:30正式开始。新版AlphaGo摈弃了人类棋谱，只靠深度学习的方式成长起来挑战围棋的极限。
世界第一棋手对弈深度学习智能AlphaGo谁输谁赢

在开赛前夜，柯洁更新微博表示“现在的AI进步之快远超我们的想象，可它始终都是冷冰冰的机器，与人类相比，我感觉不到它对围棋的热情和热爱，无论结果，这将是我最后的三盘人机大战”。

AlphaGo机器学习技术

AlphaGo 是第一个击败人类职业围棋选手并战胜围棋世界冠军的程序。
为了应对围棋的巨大复杂性，AlphaGo 采用了一种新颖的机器学习技术，结合了监督学习和强化学习的优势。通过训练形成一个策略网络（policy network），将棋盘上的局势作为输入信息，并对所有可行的落子位置生成一个概率分布。然后，训练出一个价值网络（value network）对自我对弈进行预测，以 -1（对手的绝对胜利）到1（AlphaGo的绝对胜利）的标准，预测所有可行落子位置的结果。这两个网络自身都十分强大，而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索（MCTS）中，实现了它真正的优势。最后，新版的AlphaGo 产生大量自我对弈棋局，为下一代版本提供了训练数据，此过程循环往复。

AlphaGo 如何决定落子？

在获取棋局信息后，AlphaGo 会根据策略网络探索哪个位置同时具备高潜在价值和高可能性，进而决定最佳落子位置。在分配的搜索时间结束时，模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后，AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

在刚刚结束的AlphaGo与柯洁的首场比赛中，AlphaGo以1/4子获胜。

在此之前创新工场李开复评价道，此次对决人类胜率几乎为零。AlphaGo 采用了一种新颖的机器学习技术，人工智能的发展超越了人类思维的高速运算，人工智能越来越多的被应用到人脸识别打卡系统，商城服务机器人，百度大脑，医护陪伴机器人，东时Python人工智能课程深入Python机器学习，输入学子进入人工智能世界，机器跟人类智慧的交锋将再次推动人工智能和人类社会的发展。

本文转自https://www.itdongshi.com/show/158.html

ccnanxi

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
人机大战|深度拆解AlphaGo套路

人工智能与人类智慧的再一次正面对决，5月23日上午，“中国围棋峰会”在乌镇拉开帷幕，备受关注的世界第一棋手柯洁与AlphaGo 2.0的第一场比赛于10:30正式开始。新版AlphaGo摈弃了人类棋谱，只靠深度学习的方式成长起来挑战围棋的极限。
复制链接

扫一扫