2020年12月_c-minus

12月 06月 04月

原创强化学习：贝尔曼方程与马尔可夫决策过程

强化学习：贝尔曼方程与马尔可夫决策过程一、简介贝尔曼方程和马尔可夫决策过程是强化学习非常重要的两个概念，大部分强化学习算法都是围绕这两个概念进行操作。尤其是贝尔曼方程，对以后理解蒙特卡洛搜索、时序差分算法以及深度强化学习算法都至关重要。这篇文章主要介绍贝尔曼方程。常用的资料：《Reinforcement Learning: An Introduction》 author: Richard S.Sutton and Andrew G.BartoUCL Course: https://www.dav

2020-12-18 21:06:07 3688 3

原创 clickhouse源码安装（无sudo权限，gcc、cmake、ninja源码安装）

ClickHouse 源码安装（无sudo情况下，gcc,cmake,ninja源码安装）简介由于工作和学习的需要，需要使用clickhouse数据库。如果只是限于日常的简单使用，那么不需要源码安装；如果涉及到对clickhouse的改造和开发，则必须要利用源码安装。而且限制于个人的身份，很难去获取sudo权限，因此安装各种软件就会收到限制。下面就介绍一下，非sudo权限下源码安装clickhouse的全部过程。gcc安装 clickhouse支持的gcc版本为10.0以上，而大部分linu

2020-12-16 16:02:01 2706

原创强化学习：强化学习简介

强化学习：强化学习简介一、简介由于工作和研究的需要，不得不接触一部分的强化学习课程。而强化学习系列大部分原理都涉及到相当多的数学原理，啃起来也比较麻烦。我在学习的过程中，也是参考了多方资料，整个系列看下来，深感只有真正动手coding才能理解到强化学习的精髓吧。但碍于时间的限制，我并没有真正的去动手编程，而是粗略的去阅读了别人的源码，这一部分欠缺，等日后有时间了再补上去。常用的资料：《Reinforcement Learning: An Introduction》 autho

2020-12-15 19:35:27 540

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 强化学习： 贝尔曼方程与马尔可夫决策过程

原创 clickhouse源码安装（无sudo权限，gcc、cmake、ninja源码安装）

原创 强化学习：强化学习简介

空空如也

空空如也

原创强化学习：贝尔曼方程与马尔可夫决策过程

原创强化学习：强化学习简介