AlphaGo 用了哪些深度学习的模型
AlphaGo用了一个深度学习的模型:卷积神经网络模型。阿尔法围棋(AlphaGo)是一款围棋人工智能程序。其主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。
一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。
这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。
扩展资料:阿尔法围棋用到了很多新技术,如神经网络、深度学习、蒙特卡洛树搜索法等,使其实力有了实质性飞跃。
美国脸书公司“黑暗森林”围棋软件的开发者田渊栋在网上发表分析文章说,阿尔法围棋系统主要由几个部分组成:一、策略网络(PolicyNetwork),给定当前局面,预测并采样下一步的走棋;二、快速走子(Fastrollout),目标和策略网络一样,但在适当牺牲走棋质量的条件下,速度要比策略网络快1000倍;三、价值网络(ValueNetwork),给定当前局面,估计是白胜概率大还是黑胜概率大;四、蒙特卡洛树搜索(MonteCarloTreeSearch),把以上这三个部分连起来,形成一个完整的系统。
参考资料来源:百度百科-阿尔法围棋(围棋机器人)百