gongchenooo-CSDN博客

原创机器学习Note：性能度量

机器学习Note：性能度量1. 精度 vs 错误率2. 准确率precision vs. 召回率recall参考西瓜书，仅当做自己学习笔记使用。1. 精度 vs 错误率精度: acc=1n∑i=1n1{f(xi)=yi}=∫x1f(x)=yp(x)dxacc=\frac{1}{n}\sum\limits_{i=1}^n1_{\{f(x_i)=y_i\}}=\int_{x}1_{f(x)=y}p(x)\mathrm{d}xacc=n1i=1∑n1{f(xi)=yi}=∫x1f(x)=yp

2021-07-13 23:00:17 129

原创学习笔记：强化学习与最优控制（Chapter 2）

Approximation in Value Space学习笔记：强化学习与最优控制（Chapter 2）Approximation in Value Space2.1 approximation method如我们之前所说，最优控制问题虽然可以用动态规划来解决，但是要求所有状态xkx_kxk的optimal cost-to-go需要花费很长的时间，所以有着各种各样的approximation方法。2.1 approximation method在动态规划求解最优控制的过程中，有两种估计方法：

2021-07-13 11:15:54 1285 1

原创学习笔记：强化学习与最优控制（Chapter 0）

学习笔记：强化学习与最优控制（Chapter 0）1. Model-based vs Model-free本章简单介绍一些强化学习中的概念，推荐先看Chapter1了解一下强化学习的一些数学表达式子。1. Model-based vs Model-free一个finite horizon动态规划问题是由以下几个参数定义的：状态xkx_kxk，控制uku_kuk，扰动（disturbance）wkw_kwk及其分布，代价函数gk(xk,uk,wk)g_k(x_k,u_k,w_k)gk(xk,

2021-07-11 17:25:13 819

原创学习笔记：强化学习与最优控制（Chapter 1）

学习笔记：强化学习与最优控制（Chapter 1）1.1 Deterministic Programming1.1.1 Deterministic Problems本博客参考课本Reinforcement Learning and Optimal Control，由Dimitri P. Bertsekas书写1.1 Deterministic Programming1.1.1 Deterministic Problemsfinite horizon problems: 包含有限的决策序列dete

2021-07-11 11:33:58 1453

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 机器学习Note：性能度量

原创 学习笔记：强化学习与最优控制（Chapter 2）

原创 学习笔记：强化学习与最优控制（Chapter 0）

原创 学习笔记：强化学习与最优控制（Chapter 1）

空空如也

空空如也

原创机器学习Note：性能度量

原创学习笔记：强化学习与最优控制（Chapter 2）

原创学习笔记：强化学习与最优控制（Chapter 0）

原创学习笔记：强化学习与最优控制（Chapter 1）