自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

KunBB的博客

记录学习点滴

  • 博客(5)
  • 资源 (3)
  • 收藏
  • 关注

原创 Reinforcement Learning:An Introduction Chapter 1 Introduction

Chapter 1: Introduction人类与环境进行互动,学习环境如何响应我们的行为,并试图通过自身行为影响将来发生的事,这就是一种交互式的学习方式,是人类获取知识的主要来源,同时也是几乎所有学习和智能化理论的基本思想。强化学习正是一种从交互中学习的计算方法,它更侧重于从交互中进行目标导向的学习方式,而不是其他的机器学习方式。1.1 Reinforcement Learning强化...

2019-03-22 09:58:19 1174

原创 David Silver强化学习课程 Lecture 2: Markov Decision Processes

文章目录AbstractMarkov PropertyMarkov ChainExample:Student Markov ChainMarkov Reward ProcessExample: Student Markov Reward ProcessReturn(回报)Value functionExample: Student MRP ReturnsBellman EquationExampl...

2019-03-22 09:58:07 591

原创 Reinforcement Learning:An Introduction Chapter 2 Multi-armed Bandits

文章目录Abstract2.1 k-摇臂赌博机Abstract强化学习使用训练信息来评估所采取的动作,而非使用正确的动作来指导动作的选择。评估性反馈完全依赖于所采取的动作,而指示性反馈独立于所采取的动作。本章讨论的是在单个状态下学习如何采取动作,即非关联性(nonassociative)。2.1 k-摇臂赌博机问题描述:k-摇臂赌博机可以看做k个老虎机,每个老虎机的奖赏都是从某个固定...

2019-03-22 09:58:00 654 2

原创 Reinforcement Learning:An Introduction & David Silver & CS294 强化学习课程 学习笔记

笔记Chapter 1 Introduction;Chapter 2 Multi-armed Bandits;Chapter 3 Finite Markov Decision Processes;由于时间有限,第三章开始的笔记链接到的是References中的文章。以后有时间,有新的感悟或补充,会写出来以供交流。References[1] Reinforcement Learning:...

2019-03-22 09:57:48 319

原创 David Silver强化学习课程 Lecture 1: Introduction to Reinforcement Learning

.

2019-03-22 09:57:37 767

VS2010之MFC入门到精通教程

VS2010之MFC入门到精通教程(1-55全部) 资源来自网络,仅用于交流学习。侵删。谢谢。

2018-07-06

mfc贪吃蛇程序

通过w、a、s、d或上、下、左、右控制蛇身移动,随着蛇身长度的增加蛇的移动速度会加快。 适用于新手,比较有参考意义。

2016-12-06

mfc绘制贝塞尔曲线曲面

通过绘图选项选择绘制贝塞尔曲线或贝塞尔曲面。 左键选择控制点,右键进行绘制。 按delete键清除当前窗口图形并可以开始重新绘制。 按Y键进入控制点移动功能,将鼠标移动到需要移动的控制点并按住左键开始移动,按N键退出控制点移动功能。

2016-12-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除