机器学习笔记
ztchao1996
加油
展开
-
机器学习之数学基础
目录Chapter 1 数学基础1.1 向量和矩阵转载自Github高赞机器学习项目Chapter 1 数学基础1.1 向量和矩阵标量(scalar)一个标量表示一个单独的数,它不同于线性代数中研究的其他大部分对象(通常是多个数的数组)。我们用斜体表示标量。标量通常被赋予小写的变量名称。向量(vector)一个向量表示一组有序排列的数。通过次序中的索引,我们...转载 2019-07-08 21:19:30 · 177 阅读 · 0 评论 -
强化学习之值函数估计
目录值函数估计介绍增量方法值函数估计介绍大规模的MDP,存在两个缺点:状态和动作过多。 计算太慢以至于不能学习到每个状态的值。三种估计的方式。函数逼近的方法增量方法表格查找法是值函数估计的特殊情况:增量预测算法基于MC的值函数估计广义策略迭代方法动作值函数估计控制算法的收敛...原创 2019-07-16 22:16:16 · 899 阅读 · 0 评论 -
机器学习之机器学习基础
目录机器学习基础2.1 基本概念机器学习基础机器学习是人工智能的一个子集,目前已经发展出许多有用的方法,比如支持向量机SVM,回归Regression,决策树DT,随机森林randomForest,强化方法RL,集成学习ensemble,深度学习deeplearning等等,一定程度上可以帮助人们完成一些数据预测,自动化,自动决策,最优化等初步替代脑力的任务。本章我们主要介绍下机...转载 2019-07-08 22:44:41 · 309 阅读 · 0 评论 -
强化学习之model free control
model free control 能解决什么问题?》策略迭代的基本操作贪心策略提高值函数:采用Monte Carlo 策略迭代,Greedy in the limit with infinite explorationMC 和 TD 控制的区别Sarsa算法On policy control with sarsa...原创 2019-07-10 15:07:29 · 221 阅读 · 0 评论