自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 一点关于强化学习算法选择的小建议(DDPG算法弊端)

深度学习领域还是一个很不成熟的领域,算法都在飞速更新迭代中。笔者使用的训练环境是从非强化学习问题中移植过来的,需要自行设定奖惩函数,对新手来说没有经验参考或数值处理工作量太大,都会导致参数数量级不一致,混合进神经网络开始计算梯度的时候就会相互影响,导致不合理的权重更新,需要对输入的样本和奖励值进行归一化处理,至少也要使它们处在1左右的同一数量级。,更容易收敛,对调参要求小,适合新手使用。4、同样是critic-actor算法,,加载模型验证时也只输出边界值。1、经过笔者实践及前辈描述,

2024-05-09 19:58:14 279

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除