自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 机器学习Note:性能度量

机器学习Note:性能度量1. 精度 vs 错误率2. 准确率precision vs. 召回率recall参考西瓜书,仅当做自己学习笔记使用。1. 精度 vs 错误率精度: acc=1n∑i=1n1{f(xi)=yi}=∫x1f(x)=yp(x)dxacc=\frac{1}{n}\sum\limits_{i=1}^n1_{\{f(x_i)=y_i\}}=\int_{x}1_{f(x)=y}p(x)\mathrm{d}xacc=n1​i=1∑n​1{f(xi​)=yi​}​=∫x​1f(x)=y​p

2021-07-13 23:00:17 66

原创 学习笔记:强化学习与最优控制(Chapter 2)

Approximation in Value Space学习笔记:强化学习与最优控制(Chapter 2)Approximation in Value Space2.1 approximation method如我们之前所说,最优控制问题虽然可以用动态规划来解决,但是要求所有状态xkx_kxk​的optimal cost-to-go需要花费很长的时间,所以有着各种各样的approximation方法。2.1 approximation method在动态规划求解最优控制的过程中,有两种估计方法:

2021-07-13 11:15:54 911 1

原创 学习笔记:强化学习与最优控制(Chapter 0)

学习笔记:强化学习与最优控制(Chapter 0)1. Model-based vs Model-free本章简单介绍一些强化学习中的概念,推荐先看Chapter1了解一下强化学习的一些数学表达式子。1. Model-based vs Model-free一个finite horizon动态规划问题是由以下几个参数定义的:状态xkx_kxk​,控制uku_kuk​,扰动(disturbance)wkw_kwk​及其分布,代价函数gk(xk,uk,wk)g_k(x_k,u_k,w_k)gk​(xk​,

2021-07-11 17:25:13 776

原创 学习笔记:强化学习与最优控制(Chapter 1)

学习笔记:强化学习与最优控制(Chapter 1)1.1 Deterministic Programming1.1.1 Deterministic Problems本博客参考课本Reinforcement Learning and Optimal Control,由Dimitri P. Bertsekas书写1.1 Deterministic Programming1.1.1 Deterministic Problemsfinite horizon problems: 包含有限的决策序列dete

2021-07-11 11:33:58 1239

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除