自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (1)
  • 收藏
  • 关注

原创 深度强化学习——连续动作控制DDPG、NAF

传统的DQN只适用于离散动作控制,而DDPG和NAF是深度强化学习在连续动作控制上的拓展。

2017-06-14 16:03:22 49718 8

原创 深度强化学习——A3C

异步的优势行动者评论家算法(Asynchronous Advantage Actor-Critic,A3C)是Mnih等人根据异步强化学习(Asynchronous Reinforcement Learning, ARL) 的思想,提出的一 种轻量级的 DRL 框架,该框架可以使用异步的梯度下降法来优化网络控制器的参数,并可以结合多种RL算法。

2017-06-13 20:32:33 52369 3

原创 深度强化学习——Dueling-DDQN

深度双Q网络(DDQN)和基于竞争构架Q网络(Dueling-DQN)都是DQN的改进版本,前者是对DQN训练算法的改进,后者是对DQN模型结构的改进。

2017-06-13 09:38:56 32575

原创 机器人手眼协调——机械臂自主抓取物体

KinectV2作为视觉输入,获取目标物体以及机械臂各关节在三维空间中的位置,结合几何运动学和数据训练方法实现机械臂自主抓取目标物体。

2017-06-10 19:45:01 50232 10

原创 深度强化学习控制移动机器人

使用深度强化学习控制移动机器人在复杂环境中避障、收集物品到指定点。所用到的算法包括DQN、Deuling-DDQN、A3C、DDPG、NAF。

2017-06-10 17:47:31 14249 3

原创 无人机姿态融合——EKF

使用惯性测量单元IMU和磁场传感器(磁力计)的信息,通过EKF对四旋翼无人机进行姿态融合。

2017-06-09 22:12:14 12561

原创 IMU姿态融合(MPU9250从校正到滤波步骤)

MPU9250包括三轴加速度计、三轴陀螺仪和三轴磁力计。因为加速度/磁力计具有高频噪声(需要低通滤波),将加速度/磁力计的信号看成是音频信号,它们的信号会有很多“毛刺“,也就是说它们的瞬时值不够精确,解算出来的姿态会震荡,但长期来看姿态方向是对的。而陀螺仪具有低频噪声(需要高通滤波),即每个时刻的得到的角速度是比较精确的,使用积分就能得到旋转角度

2017-06-08 21:06:39 75157 13

原创 深度强化学习——DQN

DQN(Deep Q-Learning)可谓是深度强化学习(Deep Reinforcement Learning)的开山之作,是将深度学习与增强学习结合起来从而实现从感知(Perception)到动作( Action )的端对端(End-to-end)学习的一种全新的算法。

2017-06-05 21:55:24 113223 20

翻译 四元数与旋转——学习笔记(三)

四元数与旋转——学习笔记(一) 四元数与旋转——学习笔记(二) 四元数与旋转——学习笔记(三)五、四元数的微分和积分假设前面公式(1)给出的四元数是时间 tt 的函数。则对 q(t)q(t) 求导有: q=q0˙+q˙=q0˙+q1˙i^+q2˙j^+q3˙k^q=\dot{q_0}+\dot{\boldsymbol{q}}=\dot{q_0}+\dot{q_1}\hat{i}+\dot{q_

2017-06-01 15:05:53 17314 2

翻译 四元数与旋转——学习笔记(二)

四元数与旋转——学习笔记(一) 四元数与旋转——学习笔记(二) 四元数与旋转——学习笔记(三)三、四元数旋转算子四元数原本是表示四维空间R4\Re^4的,而在对三维空间R3\Re^3的向量v=(xv,yv,zv)\boldsymbol{v}=(x_v,y_v,z_v)进行运算时使用的是纯四元数,该四元数的实数部分为0。因此向量v\boldsymbol{v}的四元数表示为xvi^+yvj^+zvk

2017-06-01 11:28:08 4782

翻译 四元数与旋转——学习笔记(一)

一、引言三维空间里向量或坐标系之间的旋转关系可以用3×33\times3的标准正交矩阵表示,称为旋转矩阵。但是,旋转矩阵中的9个元素只有4个是独立的,因此它是冗余的,而且它的几何解释也不够清楚。此外,在进行两次旋转时,两个旋转矩阵相乘需要进行27次乘法和18次加法操作。四元数(quaternion),是在1843年W.R.Hamilton与他妻子在都柏林皇家运河边散步时突然想到的,他把四元数乘法的基

2017-06-01 11:02:15 8699

平衡二叉树操作的演示

1、建立平衡二叉树并进行创建、增加、删除、调平等操作。 2、设计一个实现平衡二叉树的程序,可进行创建、增加、删除、调平等操作,实现动态的输入数据,实时的输出该树结构。 3、测试数据:自选数据

2013-12-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除