- 博客(1)
- 资源 (10)
- 收藏
- 关注
原创 算法学习之---蓄水池抽样问题
问题:如何在无限大的数据流中随机选取K个数据,保证当前遍历过的i个元素中每一个元素被选中的概率均为 k/i?从而对于n个元素,每个元素被选中的概率均为 k/n。解:对于前k个元素,我们直接选中放入一个虚拟的蓄水池中,对于第 k+1 个元素,我们用 k/(k+1) 的概率选中它,一旦选中了,就随机替换掉蓄水池中的某一个元素,这样前 k 个被选中的元素在第 k+1 个元素到来时依然被选中的概率即为
2014-09-17 22:03:16 1355
hadoop 2.2.0 native文件夹库文件-64bit版
hadoop 2.2.0自带的native文件夹里的库文件是32位版本的,如果你的系统是64位的,那么配置过程中会报错,所以需要自己重新编译为64位的,但是重新编译很麻烦,这里直接提供给大家-64bit版
2014-03-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人