自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 Docker学习笔记三(容器的数据卷)

Docker个人学习笔记,希望对你我都有帮助!

2023-06-07 16:40:20 167

原创 Docker学习笔记二(基础操作)

​ 在学习的过程中,教程推荐采用阿里云的镜像操作,这边附上阿里云官方镜像加速的地址,只要支付宝登录了即可正常跳转。

2023-06-06 16:54:01 107

原创 Docker学习笔记一(腾讯云下安装与部署)

自己学习Docker的个人心得与笔记,希望对你我都有帮助

2023-06-05 15:06:15 291

原创 Github遇到的问题解决方案

自己记录遇到git使用过程中问题的笔记

2022-11-22 21:42:07 521

原创 强化学习卫星论文笔记

自己记录强化学习卫星控制论文

2022-11-17 10:38:17 142

原创 Linux复习笔记

Linux个人学习笔记,来源于黑马网课

2022-09-05 10:21:02 71

原创 动态代理复习笔记

Java动态代理知识点复习,学习来源于B站黑马

2022-09-04 22:20:50 147

原创 Java反射学习笔记

Java反射知识点,在黑马网课学习时记录

2022-08-24 14:37:45 112

原创 Java网络通信编程知识点

黑马程序员网课,自己的学习笔记

2022-08-18 21:04:30 300

原创 多线程学习知识点笔记

个人看黑马网课总结多线程的初级学习笔记

2022-08-16 22:19:27 249

原创 强化学习学习

强化学习,torch.save和torch.load的问题

2022-06-30 21:32:07 169

原创 本周DQN实验报告

本周DQN实验报告周一周一尝试修改Reward,将奖励由原来的按具体时间给奖励,变为方差等给值方法,没有使得网络偏向理想的方向,还是出现了局部动作集中化。周二周二尝试修改网络,由原来的Net和Net2衍生了Net3作为迟滞网络,并尝试将Net1设置为逐步的网络(只接受非结果的所有步骤信息),将Net2设置为结果网络(只接受所有工序做完时的结果信息)。当store满时,对Net进行覆盖传值接着每一次反向传递前,运用Net3进行进行DQN传统公式计算。当store2满时,也进行相似操作。结果虽然并非只卡

2021-04-01 13:50:56 343 1

原创 DQN学习笔记

DQN学习笔记马尔可夫决策过程四大基本要件S状态 stateA动作 actionR即时奖励 reward 通常是a和s的函数状态间的转换规则p(s′∣s,a)p(s'|s,a)p(s′∣s,a) transiton probability2048马尔可夫过程基本构成状态:4*4的矩阵,每个值可以是2,4,8,…,2n2^n2n动作:上,下,左,右即时奖励:成功合成的新的数字之和状态间的转换规则:-初始状态是随机生成2在两个格子之中-新的砖块会随

2021-01-18 16:34:22 510

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除