人机大战|深度拆解AlphaGo套路

    人工智能与人类智慧的再一次正面对决,5月23日上午,“中国围棋峰会”在乌镇拉开帷幕,备受关注的世界第一棋手柯洁与AlphaGo 2.0的第一场比赛于10:30正式开始。新版AlphaGo摈弃了人类棋谱,只靠深度学习的方式成长起来挑战围棋的极限。
世界第一棋手对弈深度学习智能AlphaGo谁输谁赢
人机大战 深度拆解AlphaGo套路

    在开赛前夜,柯洁更新微博表示“现在的AI进步之快远超我们的想象,可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱,无论结果,这将是我最后的三盘人机大战”。


AlphaGo机器学习技术


    AlphaGo 是第一个击败人类职业围棋选手并战胜围棋世界冠军的程序。
    为了应对围棋的巨大复杂性,AlphaGo 采用了一种新颖的机器学习技术,结合了监督学习和强化学习的优势。通过训练形成一个策略网络(policy network),将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。然后,训练出一个价值网络(value network)对自我对弈进行预测,以 -1(对手的绝对胜利)到1(AlphaGo的绝对胜利)的标准,预测所有可行落子位置的结果。这两个网络自身都十分强大,而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索(MCTS)中,实现了它真正的优势。最后,新版的AlphaGo 产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。


AlphaGo 如何决定落子?


    在获取棋局信息后,AlphaGo 会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为 AlphaGo 的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。


    在刚刚结束的AlphaGo与柯洁的首场比赛中,AlphaGo以1/4子获胜。


    在此之前创新工场李开复评价道,此次对决人类胜率几乎为零。AlphaGo 采用了一种新颖的机器学习技术,人工智能的发展超越了人类思维的高速运算,人工智能越来越多的被应用到人脸识别打卡系统,商城服务机器人,百度大脑, 医护陪伴机器人,东时Python人工智能课程深入Python机器学习,输入学子进入人工智能世界, 机器跟人类智慧的交锋将再次推动人工智能和人类社会的发展。


本文转自https://www.itdongshi.com/show/158.html

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值