自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

LeeHiking的博客

机器智能、机器学习

  • 博客(5)
  • 收藏
  • 关注

原创 码云(gitee)结合vscode进行代码管理和问题解决

码云(gitee)结合vscode进行代码管理和问题解决路线注册码云(gitee)安装git安装vscode连接码云进行代码管理常见问题解决准备注册码云:进入码云官网进行注册,官网地址:https://gitee.com/,按照官网说明一步步做即可,记住用户名密码。安装git:直接git官网下载,无脑next安装即可。下载连接:https://git-scm.com/downloads安装vscode:直接官网下载,然后无脑next安装。下载连接:连接码云进行代码管理登

2021-03-16 20:39:02 1375

转载 Deep Q Network (DQN)(extend)

Double DQN (Tensorflow)要点本篇教程是基于 Deep Q network (DQN) 的选学教程. 以下教程缩减了在 DQN 方面的介绍, 着重强调 Double DQN 和 DQN 在代码上不同的地方. 所以还没了解 DQN 的同学们, 有关于 DQN 的知识, 请从 这个视频 和 这个Python教程 开始学习.接下来我们说说为什么会有 Double DQN 这种算...

2021-03-16 19:43:21 258

转载 Deep Q Network (DQN)(base)

什么是DQN今天我们会来说说强化学习中的一种强大武器, Deep Q Network 简称为 DQN. Google Deep mind 团队就是靠着这 DQN 使计算机玩电动玩得比我们还厉害.注: 本文不会涉及数学推导. 大家可以在很多其他地方找到优秀的数学推导文章.强化学习与神经网络之前我们所谈论到的强化学习方法都是比较传统的方式, 而如今, 随着机器学习在日常生活中的各种应用, 各种...

2021-03-16 19:42:38 330

转载 Sarsa

今天我们会来说说强化学习中一个和 Q learning 类似的算法, 叫做 Sarsa.注: 本文不会涉及数学推导. 大家可以在很多其他地方找到优秀的数学推导文章.在强化学习中 Sarsa 和 Q learning 及其类似, 这节内容会基于之前我们所讲的 Q learning. 所以还不熟悉 Q learning 的朋友们, 请前往我制作的 Q learning 简介 (知乎专栏). 我们...

2019-09-29 14:38:54 491 1

转载 Q Learning

行为准则 :好的行为 -> 得到奖励坏的行为 -> 没有奖励,还有惩罚比如小时候爸妈常说”不写完作业就不准看电视”.所以我们在 写作业的这种状态下,好的行为就是继续写作业, 直到写完它, 我们还可以得到奖励,不好的行为 就是没写完就跑去看电视了, 被爸妈发现, 后果很严重.Q learning 也是一个决策过程, 和小时候的这种情况差不多.我们举例说明.假设现在我们处...

2019-09-28 17:30:21 411 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除