greent2008-CSDN博客

原创强化学习中的马尔可夫决策过程

前言我在学习Playing Atari with Deep Reinforcement Learning这篇论文时，文章中引用到了马尔可夫决策过程的相关概念，为此特意学习了马尔可夫决策过程的相关知识。马尔可夫决策过程的基本概念马尔可夫决策过程由五个关键元素{S,A,{Psa},γ,R}\lbrace S, A,\lbrace P_{sa} \rbrace , \gamma, R\r

2017-01-03 16:59:30 13441 3

原创在Lubuntu上搭建python3.4和OpenCV开发环境并且运行DNQ-Atari深度学习项目

在Lubuntu上搭建python34和OpenCV开发环境并且运行DNQ-Atari深度学习项目前提条件具体步骤略去搭建Lubuntu虚拟机部分安装搭建OpenCV所需要的包创建python34虚拟环境下载并编译OpenCV创建cv2so软连接并测试搭建Tensorflow环境和Arcade-Learning-Environment下载Atari游戏的Rom在Lubuntu上搭建

2016-12-28 11:34:30 1946

原创在远程ubuntu 16.04中使用docker api

UCORE_LAB1练习1操作系统镜像文件ucore.img是如何一步一步生成的？（需要比较详细地解释Makefile中每一条相关命令和命令参数的含义，以及说明命令导致的结果） step1. 首先进入ucore的lab1目录，执行make V=命令，产生make.log文件 step2. vim make.log，如下图由46-48可知uco

2015-09-18 11:00:33 2135

原创第一篇博客：关于学堂在线的操作系统实验准备工作

ucore_lab0自我介绍鄙人是数学专业的，刚刚开始学习计算机方面的知识，参考了一下网上关于自学计算机技术的建议，准备系统学习一下这方面的专业课程，以前有过C，C++，java的编程基础，学习过coursera的Alogrithm I,写过几个小程序,准备一下挑战高难度,所以从学堂在线的操作系统学起，这门课的大实验是完成ucore这个小型操作系统的8个lab，ucore是基于MIT的 x

2015-09-17 11:43:34 1343

jos lab1 答案

jos的答案上海交大的操作系统实验感觉不错

2014-01-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 强化学习中的马尔可夫决策过程

原创 在Lubuntu上搭建python3.4和OpenCV开发环境并且运行DNQ-Atari深度学习项目

原创 在远程ubuntu 16.04中使用docker api