自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 问答 (2)
  • 收藏
  • 关注

原创 Iterative Linear Quadratic Gaussian(iLQG)

论文简述原论文:http://maeresearch.ucsd.edu/groups/skelton/publications/weiwei_ilqg_CDC43.pdf本文工作把一个非线性最优控制问题,在每次迭代中都在局部归化为控制理论里面研究很成熟的Linear Quadratic Gaussian(LQG)问题,然后迭代地去求解更好的控制序列,直到收敛。与强化学习的区别在于强化学习中不...

2019-09-25 15:41:12 1840

原创 Hierarchical deep reinforcement learning (H-DQN)

论文简述经典的DQN在面临环境反馈稀疏和反馈延迟的情况下无能为力。例如在 Montezuma’s Revenge 游戏中,无论DQN如何去学习均为0。原因在于这类游戏需要高级的策略。比如图中要拿到钥匙,然后去开门。这对我们而言是通过先验知识得到的。但是很难想象计算机如何仅仅通过图像感知这些内容。感知不到,那么这种游戏也就无从解决。为此,文中构造了一个两个层级的算法,顶层用于决策,确定下一步的...

2019-09-25 10:18:49 2679

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除