自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 【无标题】

高斯过程回归算法及其在控制中的应用高斯过程简介和分析高斯过程回归的直观解释多元变量的联合高斯分布高斯过程回归的在线算法基于高斯过程回归的系统收敛性分析

2022-04-17 00:18:01 855

原创 导弹拦截飞行避障问题

避障问题**避障问题(Obstacle avoidance)**在无人机、机器人领域的研究十分广泛,除了SLAM中通过视觉进行避障,控制领域也有很多进行避障控制的研究。控制领域中,通过对障碍进行数学形式的描述,进行控制算法的设计,最终达到避开障碍、到达指定位置的目的。在轨迹规划(trajectory planing)中,一般是通过在障碍边界外设定若干个点,然后一步步地设计控制算法,最终到达目标点,这和避障控制的设计过程不太一样。以上是一些个人比较片面的看法,由于对机器人控制比较陌生,所以只是浅显地记录

2021-12-01 21:42:52 1921 3

原创 【工作记录】配置高效科研工作软件

近几天一直在给新电脑打造一个更高效的科研工作平台,下载了很多高效的科研工作工具,整理一下吧:*otero:开源文献管理工具。之前下过EndNote和NotePress,最后还是弃用了,EndNote 没有标签管理,虽然可以加入关键词检索,但是即不方便也不直观,Notepress有标签功能,但是看网上评论说不稳定,我自己用了崩掉过两次,决定还是弃用了,最终选择这个。Zotero目前在我看来最值得推崇的优势就是标签化管理,十分醒目直观;第二就是可以保存网页,做记录;第三,开源的好处之一就是有更加丰富的扩展性,

2021-11-25 22:06:36 510

原创 【论文复现】Safe Exploration in Model-based Reinforcement Learning using Control Barrier Functions

记录一下近期的思考和工作,同时也希望督促自己不要懈怠。有疑问的地方大家一起讨论,有不正确的地方大家积极指正。论文简述2021年挂在ArXiV上面的一篇文章。文章的主要创新点在于:将ADP和CBF函数结合,用于实现在线的状态约束最优控制。作者还有一篇文章是CDC2020的,也是考虑ADP和CBF的结合,不过CDC那篇文章主要是将关于状态约束的Barrier Function 放到ADP的rewardfunction里面,而这篇文章是将safe control 和ADP的control分开来设计的,并分

2021-10-27 21:16:48 1908 14

原创 ADP在线自适应动态规划之持续激励条件

在线自适应动态规划之持续激励条件在在线自适应动态规划算法中,需要通过满足持续激励条件(Persistent Excitation Condition)保证critic网络权值的收敛性,一般的做法都是在算法初期在输入端引入探测噪声(Probing Noises)来保证数据的丰富性,但是由于在输入端引入噪声会给系统带来一些不好的影响,甚至可能破坏系统的稳定性。因此,出现了一些其他的方法来避免引入探测噪声,受阅读所限,我目前了解两种:Concurrent Learning(CL)Experience Re

2021-06-10 17:28:00 4605 3

原创 Reinforcement Learning and Adaptive Dynamic Programming(强化学习和自适应动态规划)

强化学习和自适应动态规划本文主要记录一下控制领域强化学习和自适应动态规划的发展,主要分为如下几个方向展开:以早期Werbos提出Actor-Critic结构的Adaptive Dynamic Programming,并大致分成四类结构,包括DHP、HDP、ADDHP、ADHDP等等,这些算法大多数是通过收集数据进行离线算法。1以Frank Lewis等人的自适应动态规划,包括On policy、Off policy和新提出的同步策略迭代,连续系统的Integral Reinforcement

2021-06-05 22:47:13 2107

原创 【论文复现】Safe reinforcement learning: A control barrier function optimization approach

【论文复现】Safe reinforcement learning: A control barrier function optimization approach作者:Zahra Marvi Bahare Kiumarsi期刊:Int J Robust Nonlinear Control时间:2020摘要本文提出了一种基于学习的屏障认证方法来学习安全的最优控制器,该控制器保证安全关键系统在其安全区域内运行,同时提供最佳性能。编码设计者目标的成本函数增加了控制屏障函数 (CBF),以确保安全性和

2021-06-05 21:33:59 4402 6

原创 2021-05-08

记录一下配置深度学习环境出现的一些问题配置深度学习框架需要安装的软件:Anaconda:清华镜像源下载python:无需单独下载,在Anaconda里构建环境时下载pycharm:jet brain官网下载,可以通过教育邮箱申请免费使用一年,也可以百度破解版。Cuda、Cudnn:直接在invidia官网下载。anconda镜像源的设置:在C:\user\ADMIN\.condarc修改如下channels: - https://mirrors.tuna.tsinghua.

2021-05-08 19:48:24 114

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除