- 博客(4)
- 收藏
- 关注
原创 机器学习Note:性能度量
机器学习Note:性能度量1. 精度 vs 错误率2. 准确率precision vs. 召回率recall参考西瓜书,仅当做自己学习笔记使用。1. 精度 vs 错误率精度: acc=1n∑i=1n1{f(xi)=yi}=∫x1f(x)=yp(x)dxacc=\frac{1}{n}\sum\limits_{i=1}^n1_{\{f(x_i)=y_i\}}=\int_{x}1_{f(x)=y}p(x)\mathrm{d}xacc=n1i=1∑n1{f(xi)=yi}=∫x1f(x)=yp
2021-07-13 23:00:17
66
原创 学习笔记:强化学习与最优控制(Chapter 2)
Approximation in Value Space学习笔记:强化学习与最优控制(Chapter 2)Approximation in Value Space2.1 approximation method如我们之前所说,最优控制问题虽然可以用动态规划来解决,但是要求所有状态xkx_kxk的optimal cost-to-go需要花费很长的时间,所以有着各种各样的approximation方法。2.1 approximation method在动态规划求解最优控制的过程中,有两种估计方法:
2021-07-13 11:15:54
911
1
原创 学习笔记:强化学习与最优控制(Chapter 0)
学习笔记:强化学习与最优控制(Chapter 0)1. Model-based vs Model-free本章简单介绍一些强化学习中的概念,推荐先看Chapter1了解一下强化学习的一些数学表达式子。1. Model-based vs Model-free一个finite horizon动态规划问题是由以下几个参数定义的:状态xkx_kxk,控制uku_kuk,扰动(disturbance)wkw_kwk及其分布,代价函数gk(xk,uk,wk)g_k(x_k,u_k,w_k)gk(xk,
2021-07-11 17:25:13
776
原创 学习笔记:强化学习与最优控制(Chapter 1)
学习笔记:强化学习与最优控制(Chapter 1)1.1 Deterministic Programming1.1.1 Deterministic Problems本博客参考课本Reinforcement Learning and Optimal Control,由Dimitri P. Bertsekas书写1.1 Deterministic Programming1.1.1 Deterministic Problemsfinite horizon problems: 包含有限的决策序列dete
2021-07-11 11:33:58
1239
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人