自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 MADDPG 你想要的

这里面和我们的Policy-Gradient唯一的区别在于,Policy-Gradient中直接就是一个Reward,但是这里的Q实际上是Critic相关的输出(td-error),并且这个输出和所有的智能体的行为,当前环境都是相关的,即,每个智能体都配备有一个专门负责其学习的Critic网络。即最优Q值会随着时间变化的问题,这会使Q-learning学习变得困难,此外环境的不稳定还会导致Q-learning的batch memory方法失效,进一步导致Deep Q Network的功能也变差。

2023-05-11 20:12:16 679

原创 神经网络常用激活函数

激活函数是应用于这些神经元输出的非线性函数,它的作用是增加神经网络的表达能力,使得神经网络可以学习更为复杂的模式。→使用LeakyReLU激活函数,它是ReLU的一种变体,将x<0区域的输出设置为一个很小的负数,解决了ReLU激活函数中可能出现的“死亡”神经元问题。没有激活函数,神经网络只是对输入进行简单的线性变换,这样的话就限制了神经网络的表达能力。公式:tanh(x) = (e^x - e^(-x))/(e^x + e^(-x))另外,激活函数还可以将神经元的输出限制在一个特定的范围内,

2023-05-04 21:07:37 288

原创 Linux 基本指令急速精通

第2,3,4个符号是usr的权限;第一个符号,如果为d,表示这是一个文件夹,如果为-,表示这是一个文件。x:execution可执行,不可执行为 -w:write 可写,不可写为 -r:read 可读,不可读为 -6.文件权限操作指令。

2023-05-03 23:33:45 121

原创 基于pytorch的简单图片分类问题实现

pytorch 图片分类 神经网络

2022-04-11 23:41:08 2601

原创 pytorch-损失函数和优化器理解

pytorch损失函数优化器

2022-04-09 22:23:56 3377

原创 神经网络常用层快速理解

神经网络,层,简单了解

2022-04-06 22:24:03 2217

原创 C语言反转链表

数据结构,链表反转

2022-03-29 11:00:50 1253

原创 在python安装orekit模块的方法

orekit 轨道

2022-03-28 18:05:58 1404

原创 DDPG核心思想

DDPG

2022-03-28 17:50:34 2113

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除