自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 强化学习: 贝尔曼方程与马尔可夫决策过程

强化学习: 贝尔曼方程与马尔可夫决策过程一、简介贝尔曼方程和马尔可夫决策过程是强化学习非常重要的两个概念,大部分强化学习算法都是围绕这两个概念进行操作。尤其是贝尔曼方程,对以后理解蒙特卡洛搜索、时序差分算法以及深度强化学习算法都至关重要。这篇文章主要介绍贝尔曼方程。常用的资料:《Reinforcement Learning: An Introduction》 author: Richard S.Sutton and Andrew G.BartoUCL Course: https://www.dav

2020-12-18 21:06:07 3688 3

原创 clickhouse源码安装(无sudo权限,gcc、cmake、ninja源码安装)

ClickHouse 源码安装 (无sudo情况下,gcc,cmake,ninja源码安装)简介​ 由于工作和学习的需要,需要使用clickhouse数据库。如果只是限于日常的简单使用,那么不需要源码安装;如果涉及到对clickhouse的改造和开发,则必须要利用源码安装。而且限制于个人的身份,很难去获取sudo权限,因此安装各种软件就会收到限制。下面就介绍一下,非sudo权限下源码安装clickhouse的全部过程。gcc安装​ clickhouse支持的gcc版本为10.0以上,而大部分linu

2020-12-16 16:02:01 2706

原创 强化学习:强化学习简介

强化学习:强化学习简介一、简介​   由于工作和研究的需要,不得不接触一部分的强化学习课程。而强化学习系列大部分原理都涉及到相当多的数学原理,啃起来也比较麻烦。我在学习的过程中,也是参考了多方资料,整个系列看下来,深感只有真正动手coding才能理解到强化学习的精髓吧。但碍于时间的限制,我并没有真正的去动手编程,而是粗略的去阅读了别人的源码,这一部分欠缺,等日后有时间了再补上去。​   常用的资料:​   《Reinforcement Learning: An Introduction》 autho

2020-12-15 19:35:27 540

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除