- 博客(3)
- 资源 (2)
- 收藏
- 关注
原创 强化学习第二:epsilon贪心算法
接着考虑前文的10臂老虎机问题。假设我们可以与老虎机交互TTT次,显然我们每次采取的行动(action)不必一成不变。记我们在ttt时刻采取行动为ata_tat,获得的回报为R(at)R(a_t)R(at)。那么,我们的目标是maxa1,a2,...,aT∑t=1TE[R(at)].\max_{a_1,a_2,...,a_T} \sum_{t=1}^T E[R(a_t)].a1,a2...
2019-03-30 10:06:45 14958 3
原创 多元函数第五:拓扑初步(3)内部,边界与外部运算
任何集合SSS都可以定义内部int(S)int(S)int(S),边界Bd(S)Bd(S)Bd(S)和外部ext(S)ext(S)ext(S)这三个集合。而对于集合T=int(S)T=int(S)T=int(S)来说,它也有它的内部int(T)=int(int(S))int(T)=int(int(S))int(T)=int(int(S)),边界Bd(T)=Bd(int(S))Bd(T)=Bd(in...
2019-03-29 21:33:05 2063
原创 多元函数第五:拓扑初步(2)开闭集的并和交
在拓扑初步(1)中,我们给出了开集和闭集的严格定义。这些定义的基础,是开球的概念。由开球,引出了内点,外点和边界点的概念。而内点,外点和边界点的集合,分别叫做内部,外部和边界。开集和闭集的概念,与边界紧密相关。如果一个集合不包含任何边界点,那么这个集合被称作开集。那么,我们可以很容易猜想,闭集就是包含所有边界点的集合。而还有许多的,介于两者之间的,包含部分边界点的集合,就既不是开集也不是闭集了。那...
2019-03-07 12:16:36 4480
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人