- 博客(1)
- 资源 (4)
- 收藏
- 关注
原创 【RL_Notes】chapter01 井字棋(tic_tac_toe)
前言:此份笔记是笔者在学习 reinforcement learning: an introduction 学习过程中所制。 1.模型训练 def train(epochs, print_every_n=500) epoches表示训练的回合数,print_every_n 默认值为500,表示每500回合打印一次。 1.1 核心思想 在这个函数中,核心思想是:将两个棋手都当成两个AI玩家(采取的...
2020-01-12 16:58:29 543
云服务器上搭建大数据伪分布式环境
本文档是笔者基于阿里云服务器CentOS 7.2搭建的Hadoop伪分布式环境,其中用到的一些工具,如:远程终端Xshell 6、文件传输软件Xftp 6。此文档亦可在其他Linux操作系统中运行,可能其中命令稍有区别,请加以注意。
2018-07-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人