- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 强化学习中的马尔可夫决策过程
前言我在学习Playing Atari with Deep Reinforcement Learning这篇论文时,文章中引用到了马尔可夫决策过程的相关概念,为此特意学习了马尔可夫决策过程的相关知识。马尔可夫决策过程的基本概念马尔可夫决策过程由五个关键元素{S,A,{Psa},γ,R}\lbrace S, A,\lbrace P_{sa} \rbrace , \gamma, R\r
2017-01-03 16:59:30 13441 3
原创 在Lubuntu上搭建python3.4和OpenCV开发环境并且运行DNQ-Atari深度学习项目
在Lubuntu上搭建python34和OpenCV开发环境并且运行DNQ-Atari深度学习项目前提条件具体步骤略去搭建Lubuntu虚拟机部分安装搭建OpenCV所需要的包创建python34虚拟环境下载并编译OpenCV创建cv2so软连接并测试搭建Tensorflow环境和Arcade-Learning-Environment下载Atari游戏的Rom在Lubuntu上搭建
2016-12-28 11:34:30 1946
原创 在远程ubuntu 16.04中使用docker api
UCORE_LAB1练习1操作系统镜像文件ucore.img是如何一步一步生成的?(需要比较详细地解释Makefile中每一条相关命令和命令参数的含义,以及说明命令导致的结果) step1. 首先进入ucore的lab1目录,执行make V=命令,产生make.log文件 step2. vim make.log,如下图 由46-48可知uco
2015-09-18 11:00:33 2135
原创 第一篇博客:关于学堂在线的操作系统实验准备工作
ucore_lab0自我介绍 鄙人是数学专业的,刚刚开始学习计算机方面的知识,参考了一下网上关于自学计算机技术的建议,准备系统学习一下这方面的专业课程,以前有过C,C++,java的编程基础,学习过coursera的Alogrithm I,写过几个小程序,准备一下挑战高难度,所以从学堂在线的操作系统学起,这门课的大实验是完成ucore这个小型操作系统的8个lab,ucore是基于MIT的 x
2015-09-17 11:43:34 1343
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人