强化学习资料,论文
文章平均质量分 63
Maggie_zhangxin
这个作者很懒,什么都没留下…
展开
-
NFQ文献中 参考文献的作用
[BM95] Boyan and Moore. Generalization in reinforcement learning: Safely approximating the value function. In Advances in Neural Information Processing Systems 7. Morgan Kaufmann, 1995. 运用多层感知器表示原创 2017-08-14 17:02:08 · 665 阅读 · 0 评论 -
自适应动态规划国内研究人员
ADP与制导律结合 导弹,作为一种强威慑与大威力打击武器,是军事强国军事变革中武器装备战略转型的优选目标,在当今信息化战争中扮演者“首当其冲,先发制人”的重要角色。然而,传统制导技术很难适应未来航空航天领域任务快速变化、多目标决策以及复杂环境下的轨迹自适应调整需求。为了提升导弹制导全方位智能化和自主化要求,将自适应动态规划(ADP)技术与导弹制导方法相结合,从而将自主智能思想引入制导律设计过原创 2018-01-27 21:02:36 · 4268 阅读 · 0 评论