无人系统
Alvin Jiao
这个作者很懒,什么都没留下…
展开
-
强化学习实验环境 II (ViZDoom, Roboschool, TensorFlow Agents, ELF, Coach)
前段时间Nature上发表的升级版Alpha Go - AlphaGo Zero再一次成为热点话题。作为其核心技术之一的Deep reinforcement learning(深度增强学习,或深度强化学习)也再一次引发关注。Alpha Zero最有意义的地方之一是它去除了从人类经验(棋谱)中学习的过程,而是完全通过“左右互博”式的学习击败了自己的“前辈”。这也很能体现强化学习的特点,就是在弱监督信息下通过”Trial and error”来自我学习。这两年DRL随着深度学习的大热也是火得不行。于是各种新原创 2020-11-26 17:08:45 · 584 阅读 · 0 评论 -
强化学习实验环境 I (MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2)
和其它的机器学习方向一样,强化学习(Reinforcement Learning)也有一些经典的实验场景,像Mountain-Car,Cart-Pole等。话说很久以前,因为没有统一的开发测试平台,大家都会自己实现,有用C/C++的,有用Python,还有用Matlab的。所以大家论文中看到的场景虽然相似,但很多时候不完全一样。这样一方面重新造轮子,另一方面还有可能因为实验环境的差别影响结果的比较。于是后面大家渐渐开始建立统一的实验平台,另一方面,由于近年来深度强化学习(Deep Reinforcement原创 2020-11-26 17:07:45 · 2400 阅读 · 0 评论 -
编队控制方法
简介 目前,实现多 AUV 系统编队航行的控制方法主要包括基于领航者-跟随者的方法、基于虚拟结构的方法、基于人工势场的方法、基于行为的方法和基于路径跟随的方法等。基于领航者-跟随者(Leader-follower)的编队控制方法 领航者-跟随者的概念最早由 Cruz提出,并且由 Wang等将其成功应用于移动机器人的编队控制中。作为目前最为常用的一种编队控制方法,其基本思想是:所有编队成员被指定为领航者或跟随者这两种角色,领航者通过沿着预定或者临时设定的路径航行,掌控整个编队的运动趋势,跟随者依原创 2020-07-14 19:52:36 · 12541 阅读 · 1 评论