自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 MountainCarContinuous-v0,基于DDPG,pytorch,200轮收敛

3、第三种奖励值设置方法还是基于state[1]的,只不过把思路稍微转换一下,即reward=abs(state[1])-2,因为时间拖的越久,total_reward肯定越低,这样的话他在第一次抵达终点之后,会愿意更多的去终点,解决了第二种方法的缺陷。2、第二种奖励值设置方法是基于state[1]的,也就是reward=abs(state[1]),表示速度越大,给予越大的奖励值,前期效果还行,但后期很难抵达终点(大概原因就是他认为不去终点更容易拿到更多奖励)

2024-05-22 23:23:13 329 3

原创 CartPole-v1无限步数(Gym,pytorch、DQN)

基于常规DQN算法(无算法层面的优化)实现CartPole-v1无限步数唯一的改动就是把奖励和当前位置产生了联系,从零开始的话大概训练1000轮左右(十分钟?)就能无限步数

2024-05-12 00:15:09 401 2

原创 塔子月赛第一场 题解

3、2333的小清新数论题。不太会做,只能暴力骗分了。2.2333的超级队列。模拟前几项找规律就行了。这题也是只会暴力骗分了。

2023-05-20 21:35:00 50

原创 ZJYC2023 浙江省大学生程序设计竞赛校内选拔赛全题题解

D:x&y=a(a二进制为1的位x和y也必须为1),x+y=s,s为剩下几位的和,即这几位不能和前面重合。K:dp,中间枚举到的值必须都是k的因子,加上这个剪枝之后就很快了。H:枚举两个点然后找跟这两个点在同一条直线上的点,注意去重!L:从前往后枚举,减去字典里重复的就行。J:从前往后枚举,直到不能再递增为止。A:正着写不方便,那倒着写就行了。F:枚举a,b然后算出c。G:从终点开始枚举bfs。

2023-04-01 17:37:36 316

原创 CSDN周赛25题解-分层遍历二叉树、查找整数、小Q整数分割

CSDN周赛25题解

2023-02-05 19:33:43 176 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除