每天一篇论文 317/365 DeepControl: Energy-Efficient Control of a Quadrotor using a Deep Neural Network

DeepControl: Energy-Efficient Control of a Quadrotor using a Deep Neural Network
摘要

四旋翼非线性动力系统的反馈控制器的综合需要在控制器的性能和在线计算要求之间进行权衡。模型预测控制器(MPC)具有良好的控制性能,但在线计算量大。在本文中,我们提出我们的经验,在一个四旋翼的MPC行为与前馈神经网络近似。为了便于训练数据的收集,我们建立了四旋翼机的近似模型,并使用Gazebo模拟器收集了足够的训练数据。从训练数据中学习的深度神经网络(DNN)控制器已经在不同的轨迹上进行了测试,以比较其与模型预测控制器的性能。实验结果表明,所设计的DNN控制器能够以较低的控制计算代价提供近似的轨迹跟踪性能,有助于提高四旋翼的飞行时间。此外,我们的DNN控制器的硬件要求明显低于MPC控制器。因此,使用基于DNN的控制器也有助于降低四旋翼的总体价格。

贡献

提出一种MPC传统控制方法结合DNN的深度控制方法。

方法

在这里插入图片描述
MPC:模型预测控制
MPC是一个优化控制算法,通过求解约束优化问题在一定的范围内减小跟踪误差。
在这里插入图片描述
但是作为MPC实现的高水平飞行控制器提供了令人满意的性能,但需要额外的硬件。这个硬件通常是一个高端计算处理器,需要消耗额外的能量。结果,四旋翼机的飞行时间缩短。为了解决性能和计算成本之间的权衡,我们提出了一个深度神经网络(DNN)为基础的控制器,使用监督学习近似MPC控制器。下面,我们简要介绍DNN体系结构。

本文提出的DNN

我们使用神经网络近似MPC在线优化器。深层神经网络由一个或多个隐藏层组成。每一个隐藏层都由与下一层所有神经元完全相连的神经元组成。神经元之间的连接是加权的。其目的是以这样的方式学习权重,使得网络能够输出由MPC为给定状态生成的控制信号作为输入。对于以X为输入向量的层l,层l的输出yl被定义为:
在这里插入图片描述
通过最小化神经网络f^(x)预测值与期望输出y之间的损失来学习参数W和B。用于回归的常用损失函数之一是huber损失
在这里插入图片描述
对W的更新
在这里插入图片描述
使用深度神经网络(DNN)离线学习MPC的优化器。神经网络能够逼近高次多项式。
我们利用神经网络的这种能力来学习MPC的优化器我们的方法包括以下两个步骤:
1) 使用学习的系统动力学创建四旋翼的仿真模型。
2) 利用仿真数据的有监督学习学习控制器

建立仿真模型

在这里插入图片描述

离线训练

在这里插入图片描述

结果

在MPC控制器和DNN控制器下测量了四旋翼机的飞行时间。尽管我们的测试车辆相当重,运行电机的功耗明显高于计算所需的功率,但我们的DNN控制器有助于将各种参考轨迹的飞行时间增加到12:5%。最后,DNN控制器的一个主要优点是硬件要求低。运行DNN控制器所需的硬件成本仅为运行MPC所需硬件成本的20%。这有助于我们降低四旋翼的总成本。
真实四旋翼旋转模型
在这里插入图片描述
使用DNN之后的效果
在这里插入图片描述
使用DNN四旋翼追踪效果
在这里插入图片描述
追踪误差
在这里插入图片描述
MPC和DNN控制输出对比
在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值