自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(123)
  • 资源 (13)
  • 收藏
  • 关注

原创 两端约束的最优控制问题及其数值解法

两端约束的最优控制问题及其数值解法

2024-08-06 20:47:36 755 1

原创 Weighted A* 改进型(1):XDP

本文的主要内容来自于文献[1],总的来说这篇文献给我的感觉就是理论证明非常精妙,最后的实际效果也是提升的非常明显。

2024-06-13 15:51:20 699

原创 彻底吃透A*算法的最优性

下面的博客将主要介绍A*算法在扩展结点(这对于寻路时间很重要)和总代价(这对于保证最后解的最优性很重要)上的最优性,并将淡化对A *完备性的介绍。

2024-06-05 13:12:49 1157

原创 Sparse A*算法的时间复杂度

对稀疏A*算法的时间复杂度进行了分析

2024-03-06 17:53:08 1046

原创 固定翼无人机飞行的动力学模型python代码

无人机动力学模型python代码

2023-12-26 11:37:51 985 2

原创 一个特殊级数的敛散性判断

海涅定理的介绍及证明,一类特殊级数的证明。

2023-10-30 00:06:40 356

原创 悬赏一个关于离散线性时变系统的稳定性证明问题

悬赏一个问题

2023-06-22 12:50:30 458

原创 强化学习中的重要收敛性结论(2):常见RL算法的收敛性

本篇blog旨在为一般的深度强化学习的收敛性结论奠定理论基础。

2023-06-07 11:43:55 787

原创 强化学习中的重要收敛性结论(1):常用定理

先说明该文章对于数学基础要求比较高,大多数的结论数学证明来自于《Mathematical Foundation of Reinforcement Learning》。了解强化学习中一些重要收敛性结论的证明过程,对设计好的强化学习算法以及了解一些强化学习中一些基本结论的由来是大有裨益的。本节将重点介绍一些随机逼近理论中的重要收敛性定理,这些定理将为后面强化学习中重要算法的收敛性分析提供理论基础。

2023-05-30 00:46:15 1098

原创 分组一致性领域超级牛的论文!

关于动态领航问题的一个很强的控制策略设计及稳定性证明!

2023-03-08 21:46:00 274 1

原创 航母舰载机仿真

航母舰载机着舰仿真

2023-03-06 16:53:01 400

原创 舰载机着舰交互模型

舰载机与环境交互的模型、包含其本身的六自由度动力学部分、海况、风场情况

2023-03-06 16:45:33 226

原创 多智能体集群协同控制笔记(1):线性无领航多智能体系统的一致性

多智能体集群协同控制笔记(1):线性无领航多智能体系统的一致性

2023-02-28 22:02:01 1755 1

原创 兰彻斯特方程的原理

发现原来兰彻斯特方程的推导是有迹可循的。但是原文章逻辑部分表述的任然有些许不够严密,下面给出完整部分。最近在研究阵形对集群作战的影响,忽然有点启发,通过文章。

2023-02-22 23:44:30 487

原创 连续非线性系统线性化理论

在工程领域的被控对象常常是非线性的动力系统。对非线性控制系统x˙fxt的稳定性分析,常常需要将非线性系统线性化成线性系统x˙Atx后,对线性系统设计的控制器放在非线性系统上,达到合适的控制效果。而实际上,这样的线性化后的系统的稳定性常常无法代替原非线性系统的稳定性。只有下时,上述二者才可以划等号。本篇博客重点研究上述非线性系统可线性化的条件(即使得线性化后的系统x˙Atx的稳定性能代替原系统x˙fxt的稳定性)。

2023-02-04 17:37:59 1938

原创 部分时变离散系统中的稳定性判据

离散时变系统x(k+1)=A(k)x(k)的稳定性判据。

2023-01-13 11:11:22 1130 1

原创 基于强化学习的多智能体任务规划(一)

在这篇文章中,相比于传统的AFSIM,作者开发了一种新的人工智能的系统。相比于传统的AI训练器有充分利用先验知识,训练步长更短更快的特点。在此我们不讨论其系统实现的具体细节,我们仅仅讨论其多智能体条件下的强化学习环境搭建问题。这里的问题是二维多智能体博弈对抗问题(MA2D)。

2022-09-26 12:29:07 4486 4

原创 基于强化学习的多战机同SEAD联合作战空战辅助决策(改进版)

多战机对地防空火力压制SEAD的改进版本强化学习环境搭建以及求解。

2022-09-23 16:01:44 1619 4

原创 基于强化学习的多战机同SEAD联合作战空战辅助决策

基于强化学习的多战机同SEAD联合作战空战辅助决策环境搭建。

2022-09-22 17:14:55 1242 2

原创 战术网络强化学习环境-基于多智能体的场景生成

提出了用于生成实际战术场景的战术模型(Tactical Model)的新概念,可将其作为DRL的输入。将游戏环境设计为一种单位能够通过通信网络共享信息以协调他们的方式策略。使用GNN的方法实现个体周围环境状态的综合。

2022-09-22 16:47:47 1593

原创 强化学习:GPU加速DQN玩倒立摆代码

强化学习:GPU加速DQN玩倒立摆代码

2022-09-15 16:26:45 1593 3

原创 基于强化学习的空战辅助决策(2D)

空域作战辅助决策的环境搭建

2022-09-09 17:44:30 5419 3

原创 连续1D空战辅助决策问题的DDPG实现

DDPG实现空战辅助决策游戏

2022-09-07 13:13:37 860

原创 基于强化学习的空域作战辅助决策(1D)

利用强化学习对空域作战进行辅助决策

2022-09-01 13:43:32 1419 2

原创 强化学习:PPO求解MountainCar问题通用代码(也适合其他环境)

PPO算法求解小车上山问题

2022-08-27 21:25:25 1349

原创 PPO算法经典论文阅读

​ 首先在论文的引言部分给出了经典的强化学习算法的不足之处:许多的经典强化学习算法在大型的模型、数据采样效率、鲁棒性(无需手动超参调整)上都有很大的提升空间。Q-Learning算法(包括函数逼近类算法)在许多简单问题上应用存在局限性,例如要满足状态空间与动作空间的离散型要求,并且其理解起来也是一件很困难的事情、而vanilla policy gradient算法的数据效率与鲁棒性较差、置信域优化算法(TRPO)相对来说比较复杂,而且对于包含噪声或参数共享(在策略函数与价值函数之间有其他的辅助任务需求)的网

2022-08-23 21:43:00 3866

原创 强化学习:A2C求解倒立摆问题代码

用A2C求解倒立摆问题

2022-08-20 00:13:07 710

原创 强化学习:伪代码汇总及用DQN求解MountainCar-v0问题代码

知识点总结以及DQN测试的惨痛教训...

2022-08-13 19:34:50 3899 1

原创 强化学习:Reinforce with Baseline求解MountainCar-v0小车上山问题

A2C网络求解MountainCar-v0问题

2022-08-12 21:47:09 1083 1

原创 强化学习:带MonteCarlo的Reinforce求解MountainCar问题

强化学习中利用策略梯度求解MountainCar问题,和官方差不多,标准化可以显著提高收敛速度。

2022-08-09 17:58:40 689

原创 强化学习:带起始探索的每次访问同策回合更新算法求解机器人找金币问题

用同策回合更新算法求解迷宫寻路问题

2022-08-02 19:16:51 307

原创 强化学习:价值迭代求解迷宫寻路问题

​价值迭代求解迷宫路径规划问题

2022-08-01 15:24:09 1274

原创 多智能体深度强化学习的多无人机协同空战决策

多智能体深度强化学习的多无人机空战决策

2022-07-30 17:04:46 1362

原创 强化学习:函数逼近动作价值函数中的半梯度下降法实现流程思维导图(结合TD算法)

强化学习:函数逼近动作价值函数中的半梯度下降法实现流程思维导图(结合TD算法)

2022-07-28 09:48:03 235

原创 SARSA与Q-Learning算法实现框架

SARSA与Q-Learning算法实现框架

2022-07-25 16:26:17 511 1

原创 Pytorch实现Boston房产数据回归分析

简单的pytorch练手

2022-07-13 17:34:35 593

原创 美对地防空火力压制系统综述(SEAD)

美对地防空火力压制系统SEAD

2022-07-12 12:15:18 438

原创 集群智能(控制方向)研究进展综述

集群智能研究进展综述

2022-07-05 13:11:03 502

原创 价值学习思维导图

价值学习思维导图

2022-07-03 21:00:01 337

原创 MDP思维导图

MDP思维导图

2022-07-03 12:28:29 162

Matlab LMI工具箱的说明书,很详细

Matlab LMI工具箱的说明书,很详细

2023-03-07

多智能体分布式控制的基本理论,介绍与应用

多智能体分布式控制,还介绍了无人机、无人车等基本的系统的建模与协同控制的理论,可以说是非常全面了。

2023-02-09

直流伺服电机控制系统simulink仿真框图(干货)

主要是对直流电机伺服控制系统的simulink描述框图,其中包含弹簧摩擦惯性电机的数学模型,以及具体的控制系统的搭建。

2022-01-02

蒙特卡洛积分计算的app

蒙特卡洛积分计算的app,以matlab2019 appdesigner为环境。

2021-07-27

esp8266和arduino联动智能家居(机械电子工程本科毕业设计).zip

机械电子工程本科生练手项目

2021-07-27

MonteCarloIntergal.exe

基于蒙特卡洛方法的可以计算任意积分的积分器。主要给科研教学人群,或者要进行大规模积分运算的人群。

2021-04-13

多重积分计算方法GUI.zip

描述了一个自己设计的GUI界面,主要是用来求解三重积分的值,用的是MonteCarlo方法,并且给出了误差和积分值的置信区间,也给出了不同曲面的三重积分计算方法。

2020-10-29

投影寻踪迹模型的应用

很仔细的描述了投影寻踪迹模型的应用和基本的原理,非常适合刚刚入门大数据的人,说实话是一个不可多得的升级教程。

2020-10-08

人工智能网课百度云资源

人工智能最全网课资源,以python为工具,适合零基础新手入门,而且附送很多的实际案例,可以说是非常经典的视频了。

2020-10-01

Python资料分享.

包含了许多python的资源和使用规范,非常适合刚开始入门python的小白,对于一般得到掌握了python的学习者来说是很好的进阶工具。

2020-09-27

SCI论文写作的基本规范

SCI论文写作的基本规范,包含了SCI论文从排版到见刊的大部分过程的细节性描述,主要是对研究生小白很适合的一般性论文写作技巧

2020-09-27

外文信息检索培训资源整理

主要是关于数学建模国赛的过程中的许多基本的知识的检索运用的培训教程,不仅仅适用于数学建模,同时也适用于各类专业知识文献的检索。

2020-09-27

模板、写作和排版.zip

总结了关于数学建模必要的模板,写作和排版的压缩包,主要是用来讲述关于数学建模的基本排版技巧,助力数学建模国赛美赛拿大奖。

2020-09-27

讲述十分详细的Matlab 教程

包含关于Matlab编程的许多基础和高超的技能,偏向数学建模的应用。讲述十分清晰易懂,专门为准备国赛的人准备。

2020-09-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除