自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

科大一小僧

生命满希望,前路由我创

  • 博客(7)
  • 收藏
  • 关注

原创 David Silver《Reinforcement Learning》课程解读—— Lecture 4: Model-Free Prediction

David Silver《Reinforcement Learning》课程解读—— Lecture 4: Model-Free PredictionDP动态规划能够解决已知environment的MDP问题,即已知S,A,P,R,γ S,A,P,R,γ,根据是否已知policy又将问题划分为prediction和control的问题。本质上来说这种known MDP问题已知environment即

2017-06-22 10:35:12 913 2

原创 C++程序设计学习笔记

最近在学习北大《C++程序设计》这门公开课,重新复习C++编程知识。笔记记录在了gitbook上,有兴趣的同学可以点击 北大C++程序设计 学习笔记 进行访问。Thanks!

2017-06-13 23:47:12 452

原创 David Silver《Reinforcement Learning》课程解读—— Lecture 3: Planning by Dynamic Programming

David Silver《Reinforcement Learning》课程解读—— Lecture 3: Planning by Dynamic ProgrammingDP用来解决MDPs的planning问题,主要解决途径有policy iteration和value iteration。目录:IntroductionPolicy EvaluationPolicy IterationVa

2017-06-07 01:25:07 1881

原创 机器学习的明天——迁移学习

浅谈迁移学习——机器学习的明天        上个月,柯洁大战AlphaGo落下帷幕,19岁的男孩少有地在比赛中落泪,赛后他为我们留下一句话,柯洁说“AlphaGo”看上去像神一样的存在,好像他是无懈可击的···        的确,DeepMind创造的AlphaGo让人为之赞叹,让柯洁为之疯狂。而背后,从机器学习的角度,充分证明了深度强化学习和大数据的重要意义。DeepMind

2017-06-02 23:32:22 11040 1

原创 David Silver《Reinforcement Learning》课程解读—— Lecture 2: Markov Decision Process

David Silver《Reinforcement Learning》课程解读 Section 2Lecture 2: Markov Decision ProcessMDPs正式描述了强化学习的环境,几乎所有的强化学习问题都可以描述为MDPs。1. Markov Process用于描述RL的环境,该环境完全可观(如当前状态完整描述了整个过程)。特性无后效/ 记忆性状态转移矩阵Pss′P_{s

2017-06-02 08:13:29 2620

原创 利用moveit在ROS RViz下仿真控制UR机械臂

利用moveit在ROS RViz下仿真控制UR机械臂       上一篇博客介绍了UR5机械臂仿真环境的搭建,接下来讲介绍一下如何利用ROS官方提供的moveit包在RViz控制UR5运动,以及RViz界面的几个主要功能介绍。       首先,让我们先了解一下UR5的RViz控制界面:       界面主要分为三部分,左上角Displays窗口主要通过修改一些参数来更改UR

2017-06-01 20:32:24 19371 3

原创 浅谈GAN生成对抗网络

浅谈GAN——生成对抗网络重要引用:深度学习新星:GAN的基本原理、应用和走向 | 硬创公开课;生成对抗网络(GAN)相比传统训练方法有什么优势?;通过拳击学习生成对抗网络(GAN)的基本原理最近总是听老板提起对抗学习,好奇之心,在网上搜集了一些相关资料,整理如下,大部分摘自重要引用的内容。近年来,基于数据而习得“特征”的深度学习技术受到狂热追捧,而其中GAN模型训练方法更加具有激进意

2017-06-01 10:58:29 15879 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除