薄荷-塘-CSDN博客

原创深度强化学习血泪调参史：从人工智障到人工智能

深度强化学习血泪调参史：从人工智障到人工智能背景算法区别功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入背景解决DQN中的过估计（over estimate）问题，DQN中Q值会不断增高，一直到很大很大。你好！这是你第一次使

2020-10-21 15:19:16 858 1

原创一图看懂Policy Gradients深度强化学习算法

有想了解DQN算法实现流程图解的童鞋，请移步这里Policy Gradients 深度强化学习算法实现流程详解前言一、PG深度强化学习算法的产生动机？二、算法原理三.算法实现流程总结前言基于Policy Gradients（策略梯度法，后文简称PG）的深度强化学习方法，思想上与基于Q-learning的系列算法有本质的不同，下面本博客争取用简洁的语言，清晰的图表对PG深度强化学习算法进行阐述，帮助初学者更好地理解算法。一、PG深度强化学习算法的产生动机？想要了解PG深度强化学习算法为什么会产生

2020-08-23 15:38:17 7260 3

原创一图看懂DQN(Deep Q-Network)深度强化学习算法

@[TOC](一图看懂DQN(Deep Q-Network)深度强化学习算法)DQN简介DQN是一种深度学习和强化学习结合的算法，提出的动机是传统的强化学习算法Q-learning中的Q_table存储空间有限，而现实世界甚至是虚拟世界中的状态是接近无限多的（比如围棋），因此，无法构建可以存储超大状态空间的Q_table。不过，在机器学习中, 有一种方法对这种事情很在行，那就是神经网络，可以将状态和动作当成神经网络的输入，然后经过神经网络分析后得到动作的 Q 值，这样就没必要在表格中记录 Q 值，而

2020-08-16 10:25:02 24550 6

第8章基于协同对抗规则的作战环推荐方法.rar

参考请注明出处

2021-07-28

论文数据（作战网络连边质量）.xlsx

双方体系装备的连边权重

2021-07-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 深度强化学习血泪调参史：从人工智障到人工智能

原创 一图看懂Policy Gradients深度强化学习算法