自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (2)
  • 收藏
  • 关注

原创 深度强化学习血泪调参史:从人工智障到人工智能

深度强化学习血泪调参史:从人工智障到人工智能背景算法区别功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入背景解决DQN中的过估计(over estimate)问题,DQN中Q值会不断增高,一直到很大很大。你好! 这是你第一次使

2020-10-21 15:19:16 814 1

原创 一图看懂Policy Gradients深度强化学习算法

有想了解DQN算法实现流程图解的童鞋,请移步这里Policy Gradients 深度强化学习算法实现流程详解前言一、PG深度强化学习算法的产生动机?二、算法原理三.算法实现流程总结前言基于Policy Gradients(策略梯度法,后文简称PG)的深度强化学习方法,思想上与基于Q-learning的系列算法有本质的不同,下面本博客争取用简洁的语言,清晰的图表对PG深度强化学习算法进行阐述,帮助初学者更好地理解算法。一、PG深度强化学习算法的产生动机?想要了解PG深度强化学习算法为什么会产生

2020-08-23 15:38:17 6718 3

原创 一图看懂DQN(Deep Q-Network)深度强化学习算法

@[TOC](一图看懂DQN(Deep Q-Network)深度强化学习算法)DQN简介DQN是一种深度学习和强化学习结合的算法,提出的动机是传统的强化学习算法Q-learning中的Q_table存储空间有限,而现实世界甚至是虚拟世界中的状态是接近无限多的(比如围棋),因此,无法构建可以存储超大状态空间的Q_table。不过,在机器学习中, 有一种方法对这种事情很在行,那就是神经网络,可以将状态和动作当成神经网络的输入,然后经过神经网络分析后得到动作的 Q 值,这样就没必要在表格中记录 Q 值,而

2020-08-16 10:25:02 23498 6

第8章基于协同对抗规则的作战环推荐方法.rar

参考请注明出处

2021-07-28

论文数据(作战网络连边质量).xlsx

双方体系装备的连边权重

2021-07-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除