- 博客(3)
- 收藏
- 关注
原创 Reservior Sampling(蓄水池采样) in Data Streams
引言在统计学习里面,采样通常分为两类,unbiased Sample(无偏采样)和biased Sample(无偏采样)。本文介绍的蓄水次采样就是一种无偏采样算法。它的特点是在对不知道样本总体个数或者样本总体个数太大,大到无法全部存放在内存中的情况下,可以保证每个样本被选取的概率是一样的,为K/N,其中K为“蓄水池”的大小,N为当前数据流中包含的样本个数。 算法描述假设有一个数据流,其中包含的样本
2016-05-30 18:39:27 1843
原创 信息论及其若干结论和部分证明过程
首先在介绍信息论之前,有必要提一下信息论之父,克劳德·艾尔伍德·香农(Claude Elwood Shannon,1916年4月30日-2001年2月26日)。他是美国著名的数学家、电子工程师、密码学家。1948年,香农发表了划时代的论文-《A Mathematical Theory of Communication》,奠定了现代信息论的基础。引言问题:给定两个离散分布,如何衡量他们之间的相似度?连
2016-05-16 21:46:27 1888
原创 linux vim下查找、替换指令
vim中查找和替换指令是在进行文本处理、编程时常有的指令,熟练地使用这些快捷指令可以让我们的工作达到事半功倍的效果。废话不多说,直接进入正题。查找指令1、vim中查找分为向上查找’?’和向下查找’/’。例如: :/abc 表示从当前位置开始向下查找abc或者*abc*(*代表任意长度的字符) :?abc 表示从当前位置开始向上查找abc或者*abc* 当然如果你想继续查找是否还有a
2016-05-14 17:32:21 3628
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人