自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_43853194的博客

原创代码实现DQN的ε-greedy（Epsilon贪婪策略），取得相反结果

DQN训练中，设置ε-greedy策略，一开始让智能体选择较多的随机动作，越后期，随机动作越小，这样的训练效果最好，但为什么在我的实验中，是相反的？

2022-11-21 10:12:32 2161 1

粒子群算法（PSO）的matlab代码最优化算法

1.使用粒子群算法求解任意函数最值（最大、最小均可） 2.计算过程中实时输出寻优图像 3.最终输出gif文件用于演示计算过程 4.粒子数、迭代次数、精度、目标函数值等可修改 5.有较多注释，简单易懂

2022-02-19

拟牛顿法之BFGS校正法 matlab代码实现最优化算法

1.分为脚本和程序文件，方便修改和调用 2.注释较多，简单易懂 3.目标函数，精度，迭代次数等条件可修改，兼容性强

2022-02-19

黄金分割法 Matlab代码实现最优化算法

1.分为脚本和程序，可修改脚本中的条件，也可直接在其他函数中调用该程序 2.自带画图显示 3.注释简单易懂

2022-02-19

为什么DQN收敛趋势的方向呈现递减趋势？越训练越倒退？

2022-12-10

DQN训练中，设置ε-greedy策略，为什么取得相反的训练结果？

2022-11-21

DQN训练中，设置ε-greedy策略，取得相反的训练结果**（智能体一开始选择最优动作，后期选择较多随机动作，为什么训练效果反而更好，是哪个环节出现问题了）

2022-11-21

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_43853194 CSDN认证博客专家 CSDN认证企业博客

码龄6年

IP 属地：安徽省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

1: 原创

202万+: 周排名

95万+: 总排名

2161: 访问

: 等级

15: 积分

0: 粉丝

3: 获赞

1: 评论

3: 收藏

私信

关注

热门文章

代码实现DQN的ε-greedy（Epsilon贪婪策略），取得相反结果 2160

分类专栏

最新文章

代码实现DQN的ε-greedy（Epsilon贪婪策略），取得相反结果

提示

确定要删除当前文章？

取消删除