自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(133)
  • 资源 (2)
  • 收藏
  • 关注

原创 强化学习 OpenAI Gym Universe Docker在Windows WSL 2安装配置最全的全记录

1. 事情的起源全记录事情的起源是为了学习Python强化学习实战,先在自己的windows操作系统的Pycharm+Anaconda+Gym配置下运行成功了CartPole示例和CarRacing示例,接着运行Universe,据说OpenAI Universe需要在Docker的镜像下运行,在安装Docker的时候偶然遇到了WSL 2,既然windows有WSL 2的Linux环境,那么直接在Linux分发上做运行,然而从此事情变得不简单了。2. 在Win10家庭版上安装Docker下载安装Doc

2021-02-02 10:58:58 2463 9

原创 python语言base64解码字节/图片/数组

python语言base64解码字节/图片/数组

2024-10-24 16:11:22 237 1

原创 python容易忘记的小语法

判断list是否为空,直接用if语句复制list类型

2024-03-06 17:05:06 438

原创 GPU命令的一些汇总

查看GPU显卡基本信息watch -n 3 nvidia-smi3表示3秒更新一次查询结果,单位是秒

2024-03-06 17:02:25 472

原创 强化学习学习记录-一些碎片

马尔可夫过程MDP是一种建模方法,很多问题都在用马尔可夫建模强化学习其实是一种模式套路目标Q网络和预测Q网络→目标Q网络中有一步是真实的,其余是预测的,预测Q网络中全部是预测的,隔一段时间用预测Q网络的参数去更新目标Q网络的参数奖励函数设计...

2024-03-06 17:00:00 424

原创 GAN学习笔记

GAN网络

2024-03-06 16:58:13 903

原创 【学习笔记】计算机视觉深度学习网络模型

计算机视觉神经网络模型算法原理

2024-03-06 14:47:16 905

原创 【学习笔记】实时机器学习算法

实时机器学习算法学习笔记

2024-03-06 14:27:41 556

原创 带有action mask动作掩码的PPO算法(附代码实现)

带有action mask动作掩码的PPO算法(附代码实现)

2023-07-03 16:01:42 3471 1

原创 gym0.26.2版本相比0.9版本用法变化

gym0.26.2版本相比0.9版本用法变化

2023-07-03 14:22:59 2627

原创 PPO玩Pendulum倒立摆代码(一个Actor网络)Pytorch实现

PPO玩Pendulum倒立摆代码(一个Actor网络)Pytorch实现

2023-07-03 11:18:43 402

原创 PPO玩Pendulum倒立摆代码(两个Actor网络)Pytorch实现

PPO玩Pendulum倒立摆代码(两个Actor网络)Pytorch实现

2023-07-03 11:11:54 712

原创 PPO算法基本原理及流程图(KL penalty和Clip两种方法)

PPO算法基本原理及流程图(KL penalty和Clip两种方法)

2023-06-30 17:06:28 16216 5

原创 PPO算法基本原理(李宏毅课程学习笔记)

PPO算法基本原理(李宏毅课程学习笔记)

2023-06-29 15:35:22 1079

原创 PolicyGradient算法玩CartPole和MountainCar代码Pytorch版本

PolicyGradient算法玩CartPole倒立摆和MountainCar小车爬山的Pytorch版本代码

2023-06-29 15:24:51 263 1

原创 gym不渲染画面的解决方案(gym版本号0.26.2)

gym0.26.2版本不渲染画面解决方案

2023-05-24 10:18:31 2351 2

原创 Policy Gradient策略梯度算法详解

Policy Gradient策略梯度算法原理

2023-05-16 16:47:51 5375

原创 DQN基本概念和算法流程(附Pytorch代码)

DQN,Deep Q Network本质上还是Q learning算法,它的算法精髓还是让Q估计​尽可能接近Q现实​,或者说是让当前状态下预测的Q值跟基于过去经验的Q值尽可能接近。在后面的介绍中Q现实​也被称为TD Target相比于Q Table形式,DQN算法用神经网络学习Q值,我们可以理解为神经网络是一种估计方法,神经网络本身不是DQN的精髓,神经网络可以设计成MLP也可以设计成CNN等等,DQN的巧妙之处在于两个网络、经验回放等trick。

2023-04-14 14:46:23 10726 1

原创 Q-learning算法介绍

Q-learning算法原理

2023-04-07 15:25:17 2442

原创 学习心得:人工智能学会CAAI常务理事张学工教授《AI技术前沿:从ChatGPU到更多突破》

学习心得:人工智能学会CAAI常务理事张学工教授《AI技术前沿:从ChatGPT到更多突破》

2023-03-07 16:57:39 215

原创 【leetcode】解题思路小结

leetcode-解题思路小结

2022-11-19 08:50:23 260

原创 【leetcode】验证回文串

leetcode-验证回文串

2022-11-15 16:22:30 196

原创 【leetcode】翻转二叉树

leetcode-翻转二叉树

2022-11-13 19:45:02 168

原创 【leetcode】平衡二叉树

leetcode-平衡二叉树

2022-11-13 19:28:26 166

原创 【leetcode】二叉树的后序遍历

leetcode-二叉树的后序遍历

2022-11-13 16:07:58 149

原创 【leetcode】用栈实现队列

leetcode-用栈实现队列

2022-11-13 08:10:24 147

原创 【剑指 Offer】链表中倒数第k个节点

剑指 Offer-链表中倒数第k个节点

2022-11-13 00:28:12 128

原创 【leetcode】链表的中间结点

leetcode-链表的中间结点

2022-11-12 23:50:31 124

原创 【leetcode】回文链表

leetcode-回文链表

2022-11-12 23:30:45 162

原创 【leetcode】相交链表

leetcode-相交链表

2022-11-12 21:39:43 139

原创 【leetcode】环形链表 II

leetcode-环形链表 II

2022-11-12 20:50:16 81

原创 【leetcode】删除排序链表中的重复元素

leetcode-删除排序链表中的重复元素

2022-11-12 19:10:29 171

原创 【leetcode】找到所有数组中消失的数字

leetcode-找到所有数组中消失的数字

2022-11-12 16:15:06 311

原创 【leetcode】移动零

leetcode-移动零

2022-11-12 15:15:23 109

原创 【leetcode】两数之和

leetcode-两数之和

2022-11-12 14:29:44 118

原创 【leetcode】爬楼梯

leetcode爬楼梯

2022-11-12 12:59:52 102

原创 强化学习教程学习比较-持续更新

强化学习教程学习比较-持续更新

2022-11-04 15:18:17 104

原创 强化学习学习笔记——问题汇总

在学习王树森教授讲解的强化学习教学过程中,遇到了几个理解上的小问题,所以写了这篇帖子记录下

2022-11-04 15:08:35 397

原创 Abaqus2019+VS2019+Fortran子程序安装关联全过程亲测有效

Abaqus2019+VS2019+Fortran子程序安装关联全过程亲测有效

2022-10-30 11:47:05 4103 1

原创 【论文阅读】DEEPLY UNCERTAIN: COMPARING METHODS OF UNCERTAINTY QUANTIFICATION IN DEEP LEARNING ALGORITHM

深度学习不确定性量化算法论文阅读分享。这是本人研究工作相关的首篇论文阅读分享,欢迎点赞、关注、收藏

2022-10-24 22:31:36 1016 2

Anylogic仿真范例CallCenter

基于Anylogic6的仿真范例,介绍了项目CallCenter的创建过程,适合入门

2014-04-18

Anylogic仿真范例billing department

基于Anylogic6的仿真范例,介绍了BillingDepartment的制作过程,适合入门学习

2014-04-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除