自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 DDPG算法——Pendulum实践(未完成)

文中采用的是gym库中的Pendulum-v1环境钟摆以随机位置开始,目标是将其摆动,使其保持向上直立。动作空间是连续的,值的区间为[-2,2]。每个step给的reward最低为-16.27,最高为0。

2025-08-08 10:50:02 335

原创 DDQN算法——CartPole应用实践

(53 封私信) DQN基本概念和算法流程(附Pytorch代码) - 知乎操作流程如图所示。

2025-07-31 17:36:13 609

原创 Q学习算法—CliffWalking悬崖寻路实践

智能体以网格的左下角位置为起点,以网格的右下角位置为终点,目标是移动智能体到达终点位置,智能体每次可以在上、下、左、右这4个方向中移动一步,每移动一步会得到-1单位的奖励。

2025-07-25 15:23:24 219

原创 【小土堆PyTorch深度学习快速入门教程】学习笔记-神经网络验证步骤

起到提高运算效率作用。

2025-07-20 11:09:18 105

原创 【小土堆PyTorch深度学习快速入门教程】学习笔记-神经网络训练步骤

的意思是如果本文件执行,则下面的内容执行;如果本文件不作为main文件,则不执行。

2025-07-18 18:01:21 274

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除