自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (1)
  • 收藏
  • 关注

原创 AlphaZero五子棋网络模型【python】

前文: AlphaGo Zero详解蒙特卡洛树搜索(MCTS)代码详解【python】代码来自 https://zhuanlan.zhihu.com/p/32089487五子棋版的AlphaZero网络一开始是公共的3层全卷积网络,分别使用32、64和128个 3\times3 的filter,使用ReLu激活函数。然后再分成policy和value两个输出。在policy这一端,先使...

2019-03-27 20:57:45 8480 2

原创 蒙特卡洛树搜索(MCTS)代码详解【python】

前文:AlphaGo Zero 详解之前看了AlphaGo Zero 的整个流程,接下来就要了解一下具体怎么实现的。毕设选择做用 AlphaGoZero 做五子棋,也在网上找到了相当不错的前人写的 代码。我要做的是先看懂他写的,然后再试试改进算法的性能。首先要实现 MCTS 的部分,原版注释用英语写的。现在我要一步一步的分析。首先创建节点类 TreeNode:class TreeNode(...

2019-03-23 23:37:09 25784 5

原创 mujoco win7下载安装

mujoco在win7环境下的下载和安装一 安装Microsoft Visual C++ 14.0下载地址: https://964279924.ctfile.com/fs/1445568-239446865这个在安装 scrapy 时候遇到过,很烦人.二 安装mjpro150 win64,下载地址:https://www.roboti.us/index.html把解压好的文件...

2019-03-21 13:32:28 4408 7

原创 AlphaGo Zero详解

AlphaGo Zero思考再三,决定研究一下 AlphaGo Zero,并把 AlphaGo Zero 的思想运用到五子棋 中,毕设就决定做这个。AlphaGo Zero 最大的亮点是:完全没有利用人类知识,就能够获得比之前版本更强大的棋力。主要的做法是:利用蒙特卡洛树搜索建立一个模型提升器在自我对弈过程中,利用提升器指导模型提升,模型提升又进一步提高了提升器的能力。蒙特卡洛树...

2019-03-20 23:21:27 25766 1

原创 毕设日志(二)

毕业设计工作日志(二)2019.3.9DQN2019.3.9今天的任务是了解Deep Q Network,以及Double DQN,Dueling DQN,Deep Deterministic Policy Gradient,A3C,Proximal Policy Optimization (PPO)等等强化学习算法。用Tensorflow实现一个简单的Deep Q Network。开...

2019-03-09 21:41:09 5405

原创 毕设日志(一)

毕业设计工作日志一2019.3.5现在开始准备做本科毕业设计,将每天的安排和进度记录下来,督促自己。首先,毕设的大致方向是深度强化学习。具体内容未知。Q1:我现在的任务是什么?A1:(1)掌握相关的知识,如深度强化学习,图像处理等等,(2)学习相关的论文并复现。Q2:我现在具体在做什么?A2:了解强化学习,并用python实现一些小例子。Q-learning算法别人的代码:来自...

2019-03-05 21:04:55 8135 1

PyQt5的各种示例代码

PyQt5的各种示例代码, This file is part of the examples of PyQt.

2017-12-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除