- 博客(4)
- 资源 (4)
- 收藏
- 关注
原创 强化学习算法学习汇总笔记 (二) — Actor Critic、DDPG、A3C、
一. Actor Critic1.基本概念 Actor Critic 为类似于Policy Gradient 和 Q-Learning 等以值为基础的算法的组合。a. 其中Actor 类似于Policy Gradient,以状态s为输入,神经网络输出动作actions,并从在这些连续动作中按照一定的概率选取合适的动作action。 b. Critic 类似于 Q-Learning 等以...
2018-06-27 14:49:55 9616 1
原创 强化学习算法学习汇总笔记 (一) — Q-learning、Sarsa、DQN、Policy Gradients
一. 强化学习的分类1.Model-free 和 Model-based Model-free 即机器人不知道外界环境信息,只能在机器人执行每一步动作后从环境中得到反馈然后去学习,只能按部就班,一步一步等待真实世界的反馈,再根据反馈采取下一步行动。诸如Q Learning, Sarsa,Policy Gradients等算法。Model-based 指机器人对环境有一定的了解,可以对环境...
2018-06-25 22:39:45 4872 1
原创 为Torch7 在ubuntu14.04 安装GraphicsMagick
一. 官网上下载安装包https://sourceforge.net/projects/graphicsmagick/?source=typ_redirect二. 进行安装$ cd GraphicsMagick$ ./configure '--with-magick=wand/GraphicsMagickWand-config' '--enable-shared'说明:第一个wit...
2018-06-10 23:00:07 390
原创 为Torch创建hdf5训练文件
Torch 是用C/CUDA作为底层实现,用LuaJIT作为接口的机器学习算法框架。HDF5是用于海量复杂数据集管理的技术,能够支持多种平台与多种语言接口(C,C++,Python等)。Torch的tutorial只提供了处理images和random tensors的方法,并没有对其他格式提供示例。本文使用将对如何创建HDF5数据集以及如何在Torch中使用HDF5文件格式做一个梳理。...
2018-06-04 20:53:41 1757
Opencv2链接CUDA9.0中cmake修改版
2019-05-29
图优化工具,G2o
2018-09-26
《Robotics, Vision and Control — Fundamental Algorithms in MATLAB》
2018-04-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人