强化学习卫星论文笔记
论文和文献收集
- https://blog.csdn.net/weixin_42467340/article/details/122421501 六根数知识导学
- https://zhuanlan.zhihu.com/p/343478932 《Softmax Deep Double Deterministic Policy Gradients》SD3论文解读
- https://zhuanlan.zhihu.com/p/379722366 Attention详解
- https://zhuanlan.zhihu.com/p/379939927 Attention(注意力机制)在强化学习中的应用
- https://blog.csdn.net/weixin_36815313/article/details/111592477人工场势法导学
- http://www.chinaaet.com/tech/designapplication/3000079906 《基于改进人工势场法的无人机在线航路规划算法》
- https://www.docin.com/p-2468549561.html 三维空间中合力的计算
人工场势
人工势场法(Artificial Potential Field)简称 APF,属于局部路径规划中常使用的一种方法。将传统力学中“场”的概念引入该方法,假设让智能体在这种虚拟力场下进行运动。如何设计引力场影响着该算法的性能,同时存在容易陷入局部极小点的局限性。
概念图如图 所示,人工势场就像构建了一个吸铁石,包括引力场和斥力场。黑色为障碍物,箭头为智能体要运动的方向,目标为“Goal”。智能体按照箭头的方向到达“Goal”,目标点像有着“吸引力”一样吸引着智能体靠近。而在障碍物附近,智能体逆着箭头的方向,好像对智能体产生“排斥力”。智能体前进的方向就是这两种力的合力的方向。
机器人在工作空间中的位置为X=[x,y]T通常的目标函数势场函数(引力场函数)为: U a t ( X ) = 1 2 k ( X − X g o a l ) 2 U_{at}(X)=\frac{1}{2}k(X-X_{goal})^2 Uat(X)=21k(X−Xgoal)2
其中k为位置增益函数, ( X − X g o a l ) (X-X_{goal}) (X−Xgoal)是智能体到目标 X g o a l X_{goal} Xgoal的相对距离,相应的吸引力为目标场势函数的负梯度
公式参考:https://zhuanlan.zhihu.com/p/548241778