强化学习卫星论文笔记

强化学习卫星论文笔记

论文和文献收集

  • https://blog.csdn.net/weixin_42467340/article/details/122421501 六根数知识导学
  • https://zhuanlan.zhihu.com/p/343478932 《Softmax Deep Double Deterministic Policy Gradients》SD3论文解读
  • https://zhuanlan.zhihu.com/p/379722366 Attention详解
  • https://zhuanlan.zhihu.com/p/379939927 Attention(注意力机制)在强化学习中的应用
  • https://blog.csdn.net/weixin_36815313/article/details/111592477人工场势法导学
  • http://www.chinaaet.com/tech/designapplication/3000079906 《基于改进人工势场法的无人机在线航路规划算法》
  • https://www.docin.com/p-2468549561.html 三维空间中合力的计算

人工场势

人工势场法(Artificial Potential Field)简称 APF,属于局部路径规划中常使用的一种方法。将传统力学中“场”的概念引入该方法,假设让智能体在这种虚拟力场下进行运动。如何设计引力场影响着该算法的性能,同时存在容易陷入局部极小点的局限性。

image-20221111230440269

概念图如图 所示,人工势场就像构建了一个吸铁石,包括引力场和斥力场。黑色为障碍物,箭头为智能体要运动的方向,目标为“Goal”。智能体按照箭头的方向到达“Goal”,目标点像有着“吸引力”一样吸引着智能体靠近。而在障碍物附近,智能体逆着箭头的方向,好像对智能体产生“排斥力”。智能体前进的方向就是这两种力的合力的方向。

机器人在工作空间中的位置为X=[x,y]T通常的目标函数势场函数(引力场函数)为: U a t ( X ) = 1 2 k ( X − X g o a l ) 2 U_{at}(X)=\frac{1}{2}k(X-X_{goal})^2 Uat(X)=21k(XXgoal)2

其中k为位置增益函数, ( X − X g o a l ) (X-X_{goal}) (XXgoal)是智能体到目标 X g o a l X_{goal} Xgoal的相对距离,相应的吸引力为目标场势函数的负梯度

公式参考:https://zhuanlan.zhihu.com/p/548241778

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值