自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 强化学习导论(第二版) 笔记

目录表格型求解方法表格近似求解方法基于函数逼近的同轨策略预测价值函数逼近的引入价值函数预测的部分逼近方法随机梯度和半梯度方法表格型求解方法表格型求解方法价值评估回顾动态规划 (Dynamic Programming)St↦Eπ[Rt+1+γv^π(st+1,wt)∣St=s]\quad S_t \mapsto \mathbf{E}_\pi[R_{t+1}+\gamma \hat{v}_\pi(s_{t+1},\mathbf{w}_t) \vert S_t=s]St​↦Eπ​[Rt+1​+γv^π

2023-05-15 17:41:25 147

原创 概率论 | 大数定律与中心极限定理

大数定律概率论中的收敛收敛概念的引入在概率论中,研究随机变量序列的收敛性是很重要的。概率论的思想发源就是以无限次数的试验得到的统计参数来近似得到试验所模拟的事实的真相。这个统计参数可以是一个具体试验的概率,数学期望,方差等等。但是在开始做一系列的研究工作之前,我们更关心的是这个试验得到的统计参数是不是能够体现试验的数字特征,否则研究本身就没有意义。收敛的引入能够为解决上述问题提供很好的基础工具,因为将随机变量序列近似转变为一个随机变量后,统计参数就有了实际意义。收敛的描述对象是随机变量序列,其中的

2020-08-26 14:14:30 473 1

原创 复变函数 | 第二部分 复变函数与解析函数

复变函数复变函数定义对应实变函数,同样也可以建立从复变量映射到复变量的函数。即可以定义映射 f:S↦S∗f:S\mapsto S^*f:S↦S∗,S,S∗⊆CS,S^*\subseteq\mathbb{C}S,S∗⊆C,对于任一复数 z∈Sz\in Sz∈S,都对应一个或多个 w∈S∗w\in S^*w∈S∗. 用记号表示为 w=f(z)w=f(z)w=f(z).上述表述中,SSS 为 定义集合,S∗S^*S∗ 为 函数值集合;SSS 是 fff 的 定义域;www 是 zzz 的 象(映象),zz

2020-08-25 14:33:35 7281

原创 复变函数 | 第一部分 复数

复数的定义基础定义:复数,实部与虚部,复平面,实轴与虚轴复数 可以定义为一对有序数对 (x,y)(x,y)(x,y),对应于 复平面 上的一点。复平面中,xxx轴定义为 实轴 ,yyy轴定义为 虚轴 。(x,0)(x,0)(x,0) 对应实轴上的点,为实数;(0,y)(0,y)(0,y) 对应虚轴上的点,称为 纯虚数 。对于一般形式的点 (x,y)(x,y)(x,y),x,yx,yx,y 分别称为复数的 实部 和 虚部 ,记作 Re z=x\mathrm{Re}\ z=xRe 

2020-08-24 21:48:23 1136

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除