算法
文章平均质量分 95
kdaHugh
这个作者很懒,什么都没留下…
展开
-
线性回归误差项方差的估计
线性回归误差项的估计原创 2022-10-23 22:13:47 · 6808 阅读 · 0 评论 -
Sutton and Barto 教材中多臂老虎机(k-armed bandit testbed)模拟
Sutton and Barto教材中多臂老虎机(k-armed testbed)模拟简介问题描述kkk-armed bandit 问题ϵ\epsilonϵ-greedy 和 greedy 算法q∗(a)q_{*}(a)q∗(a) 和 Qt(a)Q_{t}(a)Qt(a)简介在 Sutton 和 Barto 的经典教材 《Reinforcement learning - an introduction》的第二章中,有一个模拟10臂老虎机 (10-armed bandit testbed) 的例子。这原创 2021-09-18 22:08:10 · 668 阅读 · 0 评论 -
位运算遍历二进制数表示的集合的子集
遍历二进制数表示的集合的子集问题描述用二进制数表示集合暴力循环程序位运算寻找子集程序问题描述在一些算法问题中,我们常常用计算机中的二进制数来表示一个集合。在程序设计问题中常被称作是状态压缩。举个例子来说,如果有三个人{A, B, C},我们就可以用 1112111_21112 来表示这三个人组成的集合 { A,B,C }。这里的下标 2 表示是二进制数。而二进制数 1102110_21102 就可以表示 {A,B}。有时候我们须要遍历一个集合的子集,这如何用程序实现呢?这篇短文就来介绍一个小的技原创 2021-02-10 19:40:23 · 1869 阅读 · 4 评论