算法模型的建立来自于“学习、训练、调优”。
算法模型的价值
AlphaGo与围棋世界冠军柯洁进行了世纪大战,最终以3:0取得胜利。围棋棋盘上19x19的横纵交错,编织出了10^360的变化数,远远超过了当今计算机的计算能力。但是AlphaGo通过建立自己的算法模型做到了。
AlphaGo有两个大脑,第一个是神经网络大脑,它是“监督学习的策略网络”,通过观察棋盘布局企图找到最佳的下一步,它预测每一个‘合法下一步的最佳概率’,可以理解成“落子选择器”;AlphaGo的第二个大脑叫“棋局评估器”,它通过设想的棋盘分布,估计每个玩家赢得比赛的概率,通过提供整体的位置判断来配合移动选择器。
通过‘落子选择器’大脑和‘棋盘评估器’大脑, AlphaGo建立了独有算法模型,有效计算出未来棋子移动的序列,最终战胜了人类。